로그인
한국어
AI Inference Software Engineer
직군
Algorithm
경력사항
경력 3년 이상
고용형태
정규직
근무지
모빌린트 본사
서울특별시 강남구 선릉로93길 35, 나라키움 역삼B 빌딩 3층
Job Responsibilities
기술적 난제를 구조화하여 해결하고, 엔지니어의 페인 포인트를 읽는 기술(Technical Empathy)로 NPU 대중화를 앞당깁니다.
AI 추론 생태계 통합
: vLLM, llama.cpp, Ultralytics 등 글로벌 메이저 프레임워크와 모빌린트 NPU 런타임을 결합하여 고성능·고효율 추론 엔진 구현
엔지니어링 기반 기술 환류 (Feedback Flywheel)
: 현장의 기술 이슈를 분석하여 재현 가능한 코드로 구조화하고, 이를 SDK/Tool/Model Zoo의 본질적 개선으로 연결하는 제품 중심 피드백 루프 주도
배포 자동화 인프라 구축
: 300개 이상의 모델을 자동 검증하는 'Vulture' 시스템과 CI/CD 파이프라인을 고도화하여 대규모 모델 자산의 배포 품질 관리
NPU 최적화 및 프로파일링
: CV/LLM/VLM 등 다양한 워크로드에 대해 NPU SDK 기반의 경량화(Quantization) 및 컴파일 최적화 수행
개발자 경험(DX) 혁신
: 외부 엔지니어가 즉시 활용 가능한 수준의 기술 문서, 샘플 코드 및 튜토리얼을 설계하여 모빌린트 SDK의 진입 장벽 제거
Requirements
학력 및 전공
: 컴퓨터공학(CS), 전기전자(EE), 인공지능(AI) 등 관련 전공 학사 이상
또는 그에 준하는 실무 경험과 탄탄한 CS 기초 지식
을 보유하신 분
핵심 역량
: Python/C++ 중 하나 이상에 능숙하며, 딥러닝 모델의 추론/배포/최적화 과정에 대한 깊은 이해 (3년 이상 혹은 그에 준하는 실력)
논리적 문제 해결 능력
: 하드웨어와 소프트웨어의 접점에서 발생하는 복잡한 이슈의 근본 원인(Root Cause)을 추적하고, 이를 시스템적으로 해결할 수 있는 분
시스템 디버깅
: Linux 환경에서 복잡한 소프트웨어 스택의 병목을 찾아내고 성능을 프로파일링할 수 있는 역량
기술적 협업 문화
: 코드 리뷰를 즐기며, 기술적 성과와 지식을 문서화하여 동료와 공유하는 문화를 선호하시는 분
Preferred Qualifications
AI Agent 활용 역량
:
Claude Code, Gemini CLI, OpenAI Codex, Cursor 등 AI Agent 도구를 활용하여 개발 프로세스를 자동화하거나 생산성을 극대화해 본 경험
Technical Empathy (기술적 공감)
: 사용자의 입장에서 기술적 불편함을 이해하고, 이를 '쓰기 쉬운 인터페이스'나 '명확한 기술 콘텐츠'로 치환할 수 있는 역량
최신 추론 스택
: vLLM, Triton Inference Server, TensorRT 등 고성능 서빙 엔진 최적화 및 관련 오픈소스 컨트리뷰션 경험
MLOps & 자동화
: GitHub Actions, Ray, W&B 등을 활용한 대규모 실험 관리 및 테스트 자동화 구축 경험
성능 최적화 경험
: 온디바이스/엣지 환경에서의 모델 서빙 최적화 또는 저수준(Low-level) 성능 튜닝 경험
Hiring Process
서류전형 > 실무면접(1차) > 최종면접(2차) > 처우협의 > 최종 합격
제출 서류 : 이력서 및 자기소개서(필수), 성적증명서(필수), 포트폴리오(선택)
서류 전형 합격자에 한하여 개별 안내드리며, 채용절차는 사전 안내 후 변경될 수 있습니다.
Additional Information
신입 및 경력 입사자는 입사 후 3개월의 수습 기간이 적용됩니다.
장애인 및 국자유공자 등 취업 보호 대상자는 관련 법령에 따라 우대합니다.
지원서 및 제출 서류에 허위 사실이 확인될 경우, 채용이 취소될 수 있습니다.
공유하기
지원하기
AI Inference Software Engineer
Job Responsibilities
기술적 난제를 구조화하여 해결하고, 엔지니어의 페인 포인트를 읽는 기술(Technical Empathy)로 NPU 대중화를 앞당깁니다.
AI 추론 생태계 통합
: vLLM, llama.cpp, Ultralytics 등 글로벌 메이저 프레임워크와 모빌린트 NPU 런타임을 결합하여 고성능·고효율 추론 엔진 구현
엔지니어링 기반 기술 환류 (Feedback Flywheel)
: 현장의 기술 이슈를 분석하여 재현 가능한 코드로 구조화하고, 이를 SDK/Tool/Model Zoo의 본질적 개선으로 연결하는 제품 중심 피드백 루프 주도
배포 자동화 인프라 구축
: 300개 이상의 모델을 자동 검증하는 'Vulture' 시스템과 CI/CD 파이프라인을 고도화하여 대규모 모델 자산의 배포 품질 관리
NPU 최적화 및 프로파일링
: CV/LLM/VLM 등 다양한 워크로드에 대해 NPU SDK 기반의 경량화(Quantization) 및 컴파일 최적화 수행
개발자 경험(DX) 혁신
: 외부 엔지니어가 즉시 활용 가능한 수준의 기술 문서, 샘플 코드 및 튜토리얼을 설계하여 모빌린트 SDK의 진입 장벽 제거
Requirements
학력 및 전공
: 컴퓨터공학(CS), 전기전자(EE), 인공지능(AI) 등 관련 전공 학사 이상
또는 그에 준하는 실무 경험과 탄탄한 CS 기초 지식
을 보유하신 분
핵심 역량
: Python/C++ 중 하나 이상에 능숙하며, 딥러닝 모델의 추론/배포/최적화 과정에 대한 깊은 이해 (3년 이상 혹은 그에 준하는 실력)
논리적 문제 해결 능력
: 하드웨어와 소프트웨어의 접점에서 발생하는 복잡한 이슈의 근본 원인(Root Cause)을 추적하고, 이를 시스템적으로 해결할 수 있는 분
시스템 디버깅
: Linux 환경에서 복잡한 소프트웨어 스택의 병목을 찾아내고 성능을 프로파일링할 수 있는 역량
기술적 협업 문화
: 코드 리뷰를 즐기며, 기술적 성과와 지식을 문서화하여 동료와 공유하는 문화를 선호하시는 분
Preferred Qualifications
AI Agent 활용 역량
:
Claude Code, Gemini CLI, OpenAI Codex, Cursor 등 AI Agent 도구를 활용하여 개발 프로세스를 자동화하거나 생산성을 극대화해 본 경험
Technical Empathy (기술적 공감)
: 사용자의 입장에서 기술적 불편함을 이해하고, 이를 '쓰기 쉬운 인터페이스'나 '명확한 기술 콘텐츠'로 치환할 수 있는 역량
최신 추론 스택
: vLLM, Triton Inference Server, TensorRT 등 고성능 서빙 엔진 최적화 및 관련 오픈소스 컨트리뷰션 경험
MLOps & 자동화
: GitHub Actions, Ray, W&B 등을 활용한 대규모 실험 관리 및 테스트 자동화 구축 경험
성능 최적화 경험
: 온디바이스/엣지 환경에서의 모델 서빙 최적화 또는 저수준(Low-level) 성능 튜닝 경험
Hiring Process
서류전형 > 실무면접(1차) > 최종면접(2차) > 처우협의 > 최종 합격
제출 서류 : 이력서 및 자기소개서(필수), 성적증명서(필수), 포트폴리오(선택)
서류 전형 합격자에 한하여 개별 안내드리며, 채용절차는 사전 안내 후 변경될 수 있습니다.
Additional Information
신입 및 경력 입사자는 입사 후 3개월의 수습 기간이 적용됩니다.
장애인 및 국자유공자 등 취업 보호 대상자는 관련 법령에 따라 우대합니다.
지원서 및 제출 서류에 허위 사실이 확인될 경우, 채용이 취소될 수 있습니다.