AI Inference Software Engineer

직군

Algorithm

경력사항

경력 3년 이상

고용형태

정규직

근무지

모빌린트 본사서울특별시 강남구 선릉로93길 35, 나라키움 역삼B 빌딩 3층

기술적 난제를 구조화하여 해결하고, 엔지니어의 페인 포인트를 읽는 기술(Technical Empathy)로 NPU 대중화를 앞당깁니다.
AI 추론 생태계 통합: vLLM, llama.cpp, Ultralytics 등 글로벌 메이저 프레임워크와 모빌린트 NPU 런타임을 결합하여 고성능·고효율 추론 엔진 구현
엔지니어링 기반 기술 환류 (Feedback Flywheel): 현장의 기술 이슈를 분석하여 재현 가능한 코드로 구조화하고, 이를 SDK/Tool/Model Zoo의 본질적 개선으로 연결하는 제품 중심 피드백 루프 주도
배포 자동화 인프라 구축: 300개 이상의 모델을 자동 검증하는 'Vulture' 시스템과 CI/CD 파이프라인을 고도화하여 대규모 모델 자산의 배포 품질 관리
NPU 최적화 및 프로파일링: CV/LLM/VLM 등 다양한 워크로드에 대해 NPU SDK 기반의 경량화(Quantization) 및 컴파일 최적화 수행
개발자 경험(DX) 혁신: 외부 엔지니어가 즉시 활용 가능한 수준의 기술 문서, 샘플 코드 및 튜토리얼을 설계하여 모빌린트 SDK의 진입 장벽 제거

학력 및 전공: 컴퓨터공학(CS), 전기전자(EE), 인공지능(AI) 등 관련 전공 학사 이상 또는 그에 준하는 실무 경험과 탄탄한 CS 기초 지식을 보유하신 분
핵심 역량: Python/C++ 중 하나 이상에 능숙하며, 딥러닝 모델의 추론/배포/최적화 과정에 대한 깊은 이해 (3년 이상 혹은 그에 준하는 실력)
논리적 문제 해결 능력: 하드웨어와 소프트웨어의 접점에서 발생하는 복잡한 이슈의 근본 원인(Root Cause)을 추적하고, 이를 시스템적으로 해결할 수 있는 분
시스템 디버깅: Linux 환경에서 복잡한 소프트웨어 스택의 병목을 찾아내고 성능을 프로파일링할 수 있는 역량
기술적 협업 문화: 코드 리뷰를 즐기며, 기술적 성과와 지식을 문서화하여 동료와 공유하는 문화를 선호하시는 분

AI Agent 활용 역량: Claude Code, Gemini CLI, OpenAI Codex, Cursor 등 AI Agent 도구를 활용하여 개발 프로세스를 자동화하거나 생산성을 극대화해 본 경험
Technical Empathy (기술적 공감): 사용자의 입장에서 기술적 불편함을 이해하고, 이를 '쓰기 쉬운 인터페이스'나 '명확한 기술 콘텐츠'로 치환할 수 있는 역량
최신 추론 스택: vLLM, Triton Inference Server, TensorRT 등 고성능 서빙 엔진 최적화 및 관련 오픈소스 컨트리뷰션 경험
MLOps & 자동화: GitHub Actions, Ray, W&B 등을 활용한 대규모 실험 관리 및 테스트 자동화 구축 경험
성능 최적화 경험: 온디바이스/엣지 환경에서의 모델 서빙 최적화 또는 저수준(Low-level) 성능 튜닝 경험

AI Inference Software Engineer

기술적 난제를 구조화하여 해결하고, 엔지니어의 페인 포인트를 읽는 기술(Technical Empathy)로 NPU 대중화를 앞당깁니다.
AI 추론 생태계 통합: vLLM, llama.cpp, Ultralytics 등 글로벌 메이저 프레임워크와 모빌린트 NPU 런타임을 결합하여 고성능·고효율 추론 엔진 구현
엔지니어링 기반 기술 환류 (Feedback Flywheel): 현장의 기술 이슈를 분석하여 재현 가능한 코드로 구조화하고, 이를 SDK/Tool/Model Zoo의 본질적 개선으로 연결하는 제품 중심 피드백 루프 주도
배포 자동화 인프라 구축: 300개 이상의 모델을 자동 검증하는 'Vulture' 시스템과 CI/CD 파이프라인을 고도화하여 대규모 모델 자산의 배포 품질 관리
NPU 최적화 및 프로파일링: CV/LLM/VLM 등 다양한 워크로드에 대해 NPU SDK 기반의 경량화(Quantization) 및 컴파일 최적화 수행
개발자 경험(DX) 혁신: 외부 엔지니어가 즉시 활용 가능한 수준의 기술 문서, 샘플 코드 및 튜토리얼을 설계하여 모빌린트 SDK의 진입 장벽 제거

학력 및 전공: 컴퓨터공학(CS), 전기전자(EE), 인공지능(AI) 등 관련 전공 학사 이상 또는 그에 준하는 실무 경험과 탄탄한 CS 기초 지식을 보유하신 분
핵심 역량: Python/C++ 중 하나 이상에 능숙하며, 딥러닝 모델의 추론/배포/최적화 과정에 대한 깊은 이해 (3년 이상 혹은 그에 준하는 실력)
논리적 문제 해결 능력: 하드웨어와 소프트웨어의 접점에서 발생하는 복잡한 이슈의 근본 원인(Root Cause)을 추적하고, 이를 시스템적으로 해결할 수 있는 분
시스템 디버깅: Linux 환경에서 복잡한 소프트웨어 스택의 병목을 찾아내고 성능을 프로파일링할 수 있는 역량
기술적 협업 문화: 코드 리뷰를 즐기며, 기술적 성과와 지식을 문서화하여 동료와 공유하는 문화를 선호하시는 분

AI Agent 활용 역량: Claude Code, Gemini CLI, OpenAI Codex, Cursor 등 AI Agent 도구를 활용하여 개발 프로세스를 자동화하거나 생산성을 극대화해 본 경험
Technical Empathy (기술적 공감): 사용자의 입장에서 기술적 불편함을 이해하고, 이를 '쓰기 쉬운 인터페이스'나 '명확한 기술 콘텐츠'로 치환할 수 있는 역량
최신 추론 스택: vLLM, Triton Inference Server, TensorRT 등 고성능 서빙 엔진 최적화 및 관련 오픈소스 컨트리뷰션 경험
MLOps & 자동화: GitHub Actions, Ray, W&B 등을 활용한 대규모 실험 관리 및 테스트 자동화 구축 경험
성능 최적화 경험: 온디바이스/엣지 환경에서의 모델 서빙 최적화 또는 저수준(Low-level) 성능 튜닝 경험