[신입/경력] Backend Engineer (AI Platform)
About the role
직무 개요
본 포지션은 Agentic AI 플랫폼을 위한 백엔드, 데이터 플랫폼, MLOps, Cloud/On-prem 인프라, 그리고 보안까지 아우르는 End-to-End 플랫폼 엔지니어 역할을 수행합니다.
처음부터 모든 영역을 깊이 있게 아실 필요는 없습니다. 실무를 통해 아래 내용들을 전반적으로 숙지하며 특정 분야의 전문성(Specialty)을 키우고, 궁극적으로는 시스템의 경계를 넘나들며 주도적으로 문제를 정의하고 해결할 수 있는 엔지니어를 찾습니다.
주요 업무
<직무 개요 (Job Overview)>
본 포지션은 Agentic AI 플랫폼을 위한 백엔드, 데이터 플랫폼, MLOps, Cloud/On-prem 인프라, 그리고 보안까지 아우르는 End-to-End 플랫폼 엔지니어 역할을 수행합니다.
처음부터 모든 영역을 깊이 있게 아실 필요는 없습니다. 실무를 통해 아래 내용들을 전반적으로 숙지하며 특정 분야의 전문성(Specialty)을 키우고, 궁극적으로는 시스템의 경계를 넘나들며 주도적으로 문제를 정의하고 해결할 수 있는 엔지니어를 찾습니다.
<주요 업무 (Key Responsibilities)>
-
Agent 및 Workflow 기반 AI 플랫폼의 백엔드 서버 개발 및 운영
-
에이전트간 비동기 워크로드를 고려한 API 및 워커 시스템 설계·구현
-
클라우드 및 온프레미스 환경에서의 서비스 배포, 운영, 자동화
-
정형/비정형 데이터 ingestion, 저장, 조회, 분석 파이프라인 구축 및 개선
∘ 워크플로우 운용: Temporal, Airflow
∘ 데이터 플랫폼: Clickhouse, Snowflake / Databricks, Postgres, Vector DB, NATS 등
- GPU 기반 모델 서빙 및 ML 워크로드를 위한 인프라 구성 및 운영서비스 안정성을 위한 모니터링, 로깅, 장애 대응
∘ 컴퓨팅 인프라: AWS 및 Neocloud (Nebius 등) 기반 GPU 인프라 (H100, B200 운용 및 보유중. 확장 예정)
∘ GPU 기반 인프라: Sky Pilot, Ray, SGLang, vLLM 등
∘ 모니터링: Open Telemetry, Grafana
- 엔터프라이즈 환경을 고려한 보안, 권한, 멀티테넌시 구조 설계고객 환경(On-prem / Hybrid Cloud)에 대한 배포 및 운영 이슈 해결
자격 요건
- 백엔드 구현 편의가 아닌, 실제 사용자의 경험과 제품 목표를 기준으로 시스템을 설계하는 자세
- 영어 기술 문서를 읽고 레퍼런스를 기반으로 문제를 해결할 수 있는 능력
- 웹 서버 및 아키텍처 설계 경험 (Python 선호)
- 필요시 Golang, Typescript, Rust 등 다양한 언어를 다룰 수 있는 의지
- 다양한 Workflow 시스템에 대한 경험 (Temporal, Airflow, Celery 등)
- REST HTTP 이외의 다양한 프로토콜 및 분산시스템 분석 능력