[Tech] Infra Engineer
부문
Tech Division
직군
개발
경력사항
경력 3년 이상
고용형태
정규직
근무지
A41대한민국 서울특별시 서초구 강남대로 311

Accelerate a ​Verifiable ​World ​Where Proof ​Replaces Trust

  • 우리가 향유하는 온라인 ​세계는 ​신뢰를 기반으로 ​작동합니다. 어떤 콘텐츠가 ​AI가 아닌 ​사람에 ​의해 제작 ​되었다거나, ​개인의 ​신원이 안전하게 검증 ​되었다거나, ​개인정보가 안전하게 관리되고 ​있다는 ​등 ​서비스 공급자가 제공하는 ​정보를 일방적으로 ​신뢰할 ​수밖에 없기 ​때문입니다. 하지만 ​이러한 ​구조는 본질적으로 불완전하며, ​이와 같이 ​신뢰에 의존하는 시스템에는 언제든지 무너질 수 있는 위험이 도사리고 있습니다. 이미 우리는 수많은 해킹, 개인정보 유출, 소비자 기만 사례를 통해 위와 같은 취약성을 생활 속에서 경험하고 있습니다.
  • A41은 Zero-Knowledge 기술을 통해, 행위를 증명함으로써 더 이상 서비스 공급자를 신뢰하지 않아도 되는 무신뢰(Trustless) 사회로의 구조적인 전환을 추구합니다. 그간 A41은 APAC 지역의 Top Validator로서 대규모의 검증인 서비스를 안정적으로 운용해 왔으며, 이 경험을 토대로 Proof as a Service를 제공하여, Computational Integrity를 실현하고자 합니다.



포지션 소개: Infra Engineer

  • Infra Engineer는 GPU 기반의 인프라 구축부터 운영, 최적화, 자동화까지의 전 과정을 다룹니다. 안정적이고 효율적인 클러스터 운영을 통해 가용성을 높이고, 비용을 최적화하며, 체계적인 모니터링을 통해 인프라 운영의 안정성을 지속적으로 개선합니다.



Infra Engineer로서 지원을 고려하고 계신 분들께

  • A41은 단시간 내에 밀도 높은 성장을 경험했고, 이 경험을 토대로 Phase 2로 도약하기 위한 도움닫기에 집중하고 있습니다. 우리가 급격한 변화에도 불구하고 지금까지 단단한 팀을 유지할 수 있었던 것은 각자의 역할에서 공동의 목표의식과 협력을 그 무엇보다 중요하게 여겼기 때문입니다. 팀으로 승리하는 경험, 단단한 조직의 일원으로 거듭나는 경험을 쌓을 준비가 되신 분들에게 더욱 추천 드리고 싶은 포지션입니다.
  • 베어메탈 서버와 EKS 기반의 GPU 클러스터를 운영하며, 하이브리드 환경 전반을 설계하고 최적화하는 실전 경험을 쌓으실 수 있습니다. 뿐만 아니라 GPU 자원 확보부터 운영까지 비용 절감과 운영 최적화를 함께 고려하여 설계, 운영하는 과정을 통해 전략적인 인프라 운영 역량을 키우실 수 있습니다.



주요 업무

  • 베어메탈 서버 및 EKS 기반 GPU 클러스터의 구축, 운영 및 관리
  • 노드 프로비저닝, 드라이버 및 런타임 환경을 설정합니다.
  • 워크로드 특성에 맞춘 GPU 스케줄링 및 리소스 할당 정책을 설계합니다.
  • GPU 조달 및 확보 전략 수립을 통한 총 비용 최적화
  • 온프레미스 및 클라우드 등 다양한 인프라 옵션을 비교 분석하여 최적의 GPU 조달 방식을 설계합니다.
  • 자원 활용률을 모니터링하고, 예약 인스턴스 및 스팟 인스턴스를 활용하여 비용 효율성을 최적화합니다.
  • Kubernetes 인프라의 전사 표준화
  • Ansible, Kubespray를 기반으로 클러스터 구성을 자동화합니다.
  • Helm 차트 작성 및 배포 자동화 파이프라인을 구축합니다.
  • 모니터링, 로깅, 보안 구성 및 튜닝
  • Prometheus, Grafana, EFL 기반의 모니터링 스택을 구축합니다.
  • 네트워크 정책, RBAC, 방화벽 등 보안 정책을 설계하고 유지보수 합니다.
  • CI/CD 파이프라인 설계
  • GitOps 기반의 CI/CD 파이프라인을 설계하고 운영합니다.
  • 인프라 및 애플리케이션 배포를 자동화 합니다.
  • 장애 대응 및 안정성 향상
  • SLO/SLA를 설정하고, 장애 대응 및 예방 프로세스를 수립합니다.
  • 운영 지표 등을 포함한 정기 리포트를 작성합니다.



자격요건: 해당 포지션으로 업무를 시작하시는 데에 반드시 필요한 역량입니다.

  • 인프라 엔지니어로서 3~5년 이상의 경험을 쌓으신 분
  • Ansible, Kubespray, Helm 등의 도구를 실무적으로 활용해본 경험이 있으신 분
  • Kubernetes/EKS 클러스터를 구성해본 경험이 있으신 분
  • Prometheus, Grafana, EFK 등 모니터링 스택을 구성하실 수 있는 역량이 있으신 분
  • CI/CD 및 GitOps 도구(GitHub Actions, Argo CD 등)를 사용해본 경험이 있으신 분



우대사항: 해당 포지션으로 업무를 시작하는 데에 도움이 될 수 있는 역량입니다.

  • GPU 워크로드를 운영해본 경험이 있으신 분
  • GPU 조달을 위한 비용 분석을 경험해 보셨거나, TCO 절감을 위한 프로젝트를 수행해본 경험이 있으신 분
  • AWS, GCP 또는 온프레미스 혼합 아키텍처를 구성해본 경험이 있으신 분
  • 다양한 팀(데이터, 백엔드, R&D 등)과 협업하여 인프라 표준화 및 운영 가이드라인을 수립해본 경험이 있으신 분
  • 보안, 신뢰성, 비용 사이의 균형을 고려하여 기술적 의사결정을 내려본 경험이 있으신 분



Benefits

  • 휴가: 1시간 단위로 승인 없이 사용하며, 개수 제한 또한 없습니다.
  • 법인카드: 편리하게 사용하실 수 있도록 모든 구성원 분들에게 법인카드를 지급해 드립니다.
  • 성장 지원: 업무적 성장에 도움이 되는 도서, 강의, 세미나 등의 비용을 지원합니다.
  • 건강 지원: 건강하게 일 하실 수 있도록 운동, 심리상담 등의 비용을 지원합니다.
  • 장비 지원: 업무에 불편함이 없도록 최신 노트북(맥북 프로/갤럭시북), 모니터(32인치/27인치 듀얼)를 지급합니다.
  • 재택근무: 각자의 상황에 따라 부분적 재택근무 옵션을 활용할 수 있습니다.
공유하기
[Tech] Infra Engineer

Accelerate a ​Verifiable ​World ​Where Proof ​Replaces Trust

  • 우리가 향유하는 온라인 ​세계는 ​신뢰를 기반으로 ​작동합니다. 어떤 콘텐츠가 ​AI가 아닌 ​사람에 ​의해 제작 ​되었다거나, ​개인의 ​신원이 안전하게 검증 ​되었다거나, ​개인정보가 안전하게 관리되고 ​있다는 ​등 ​서비스 공급자가 제공하는 ​정보를 일방적으로 ​신뢰할 ​수밖에 없기 ​때문입니다. 하지만 ​이러한 ​구조는 본질적으로 불완전하며, ​이와 같이 ​신뢰에 의존하는 시스템에는 언제든지 무너질 수 있는 위험이 도사리고 있습니다. 이미 우리는 수많은 해킹, 개인정보 유출, 소비자 기만 사례를 통해 위와 같은 취약성을 생활 속에서 경험하고 있습니다.
  • A41은 Zero-Knowledge 기술을 통해, 행위를 증명함으로써 더 이상 서비스 공급자를 신뢰하지 않아도 되는 무신뢰(Trustless) 사회로의 구조적인 전환을 추구합니다. 그간 A41은 APAC 지역의 Top Validator로서 대규모의 검증인 서비스를 안정적으로 운용해 왔으며, 이 경험을 토대로 Proof as a Service를 제공하여, Computational Integrity를 실현하고자 합니다.



포지션 소개: Infra Engineer

  • Infra Engineer는 GPU 기반의 인프라 구축부터 운영, 최적화, 자동화까지의 전 과정을 다룹니다. 안정적이고 효율적인 클러스터 운영을 통해 가용성을 높이고, 비용을 최적화하며, 체계적인 모니터링을 통해 인프라 운영의 안정성을 지속적으로 개선합니다.



Infra Engineer로서 지원을 고려하고 계신 분들께

  • A41은 단시간 내에 밀도 높은 성장을 경험했고, 이 경험을 토대로 Phase 2로 도약하기 위한 도움닫기에 집중하고 있습니다. 우리가 급격한 변화에도 불구하고 지금까지 단단한 팀을 유지할 수 있었던 것은 각자의 역할에서 공동의 목표의식과 협력을 그 무엇보다 중요하게 여겼기 때문입니다. 팀으로 승리하는 경험, 단단한 조직의 일원으로 거듭나는 경험을 쌓을 준비가 되신 분들에게 더욱 추천 드리고 싶은 포지션입니다.
  • 베어메탈 서버와 EKS 기반의 GPU 클러스터를 운영하며, 하이브리드 환경 전반을 설계하고 최적화하는 실전 경험을 쌓으실 수 있습니다. 뿐만 아니라 GPU 자원 확보부터 운영까지 비용 절감과 운영 최적화를 함께 고려하여 설계, 운영하는 과정을 통해 전략적인 인프라 운영 역량을 키우실 수 있습니다.



주요 업무

  • 베어메탈 서버 및 EKS 기반 GPU 클러스터의 구축, 운영 및 관리
  • 노드 프로비저닝, 드라이버 및 런타임 환경을 설정합니다.
  • 워크로드 특성에 맞춘 GPU 스케줄링 및 리소스 할당 정책을 설계합니다.
  • GPU 조달 및 확보 전략 수립을 통한 총 비용 최적화
  • 온프레미스 및 클라우드 등 다양한 인프라 옵션을 비교 분석하여 최적의 GPU 조달 방식을 설계합니다.
  • 자원 활용률을 모니터링하고, 예약 인스턴스 및 스팟 인스턴스를 활용하여 비용 효율성을 최적화합니다.
  • Kubernetes 인프라의 전사 표준화
  • Ansible, Kubespray를 기반으로 클러스터 구성을 자동화합니다.
  • Helm 차트 작성 및 배포 자동화 파이프라인을 구축합니다.
  • 모니터링, 로깅, 보안 구성 및 튜닝
  • Prometheus, Grafana, EFL 기반의 모니터링 스택을 구축합니다.
  • 네트워크 정책, RBAC, 방화벽 등 보안 정책을 설계하고 유지보수 합니다.
  • CI/CD 파이프라인 설계
  • GitOps 기반의 CI/CD 파이프라인을 설계하고 운영합니다.
  • 인프라 및 애플리케이션 배포를 자동화 합니다.
  • 장애 대응 및 안정성 향상
  • SLO/SLA를 설정하고, 장애 대응 및 예방 프로세스를 수립합니다.
  • 운영 지표 등을 포함한 정기 리포트를 작성합니다.



자격요건: 해당 포지션으로 업무를 시작하시는 데에 반드시 필요한 역량입니다.

  • 인프라 엔지니어로서 3~5년 이상의 경험을 쌓으신 분
  • Ansible, Kubespray, Helm 등의 도구를 실무적으로 활용해본 경험이 있으신 분
  • Kubernetes/EKS 클러스터를 구성해본 경험이 있으신 분
  • Prometheus, Grafana, EFK 등 모니터링 스택을 구성하실 수 있는 역량이 있으신 분
  • CI/CD 및 GitOps 도구(GitHub Actions, Argo CD 등)를 사용해본 경험이 있으신 분



우대사항: 해당 포지션으로 업무를 시작하는 데에 도움이 될 수 있는 역량입니다.

  • GPU 워크로드를 운영해본 경험이 있으신 분
  • GPU 조달을 위한 비용 분석을 경험해 보셨거나, TCO 절감을 위한 프로젝트를 수행해본 경험이 있으신 분
  • AWS, GCP 또는 온프레미스 혼합 아키텍처를 구성해본 경험이 있으신 분
  • 다양한 팀(데이터, 백엔드, R&D 등)과 협업하여 인프라 표준화 및 운영 가이드라인을 수립해본 경험이 있으신 분
  • 보안, 신뢰성, 비용 사이의 균형을 고려하여 기술적 의사결정을 내려본 경험이 있으신 분



Benefits

  • 휴가: 1시간 단위로 승인 없이 사용하며, 개수 제한 또한 없습니다.
  • 법인카드: 편리하게 사용하실 수 있도록 모든 구성원 분들에게 법인카드를 지급해 드립니다.
  • 성장 지원: 업무적 성장에 도움이 되는 도서, 강의, 세미나 등의 비용을 지원합니다.
  • 건강 지원: 건강하게 일 하실 수 있도록 운동, 심리상담 등의 비용을 지원합니다.
  • 장비 지원: 업무에 불편함이 없도록 최신 노트북(맥북 프로/갤럭시북), 모니터(32인치/27인치 듀얼)를 지급합니다.
  • 재택근무: 각자의 상황에 따라 부분적 재택근무 옵션을 활용할 수 있습니다.