“AI가 모든 것을 바꾸는 지금, 딥오토는 엔지니어링 설계, 제조, 건설 산업의 패러다임을 뒤바꿀 선봉장입니다. 산업의 미래를 직접 설계할 당신을 기다립니다.” 딥오토는 설계 도면, 기술 문서 등 산업 현장의 복잡한 비정형 데이터(CAD, PDF, 이미지 등)를 AI가 이해하고 처리할 수 있는 차세대 지능형 시스템을 만들고 있습니다. 우리는 단순히 텍스트를 읽는 것을 넘어, 데이터 내부의 논리적 구조를 복원하고 자율적으로 문제를 해결하는 Agentic AI 시스템을 개발합니다.
본 인턴십은 최신 AI 기술(VLM/LLM, 강화학습, 데이터 아키텍처)을 활용하여 엔터프라이즈 환경의 기술적 난제를 정면으로 돌파하는 여정입니다. 뛰어난 동료들과 함께 딥오토 플랫폼의 기술적 진화를 주도하며, 실무 중심의 압도적인 성장을 경험할 예비 AI 엔지니어를 모십니다. 지원 시 본인의 역량과 관심사에 맞춰 아래 네 가지 트랙 중 하나를 1지망으로 선택해 주시기 바랍니다.
주요 업무
주요 업무 (Key Responsibilities)
<Track 1: 에이전트 설계 및 구현 (0명)>
멀티모달 에이전트 개발: PDF, Excel, CAD(AutoCAD, SolidWorks, CATIA) 등 다양한 포맷의 비정형 문서 구조를 분석하고, 객체 간의 연결 관계를 파악하는 LLM/VLM 에이전트 워크플로우를 설계합니다.
Agentic System 고도화: 에이전트가 복잡한 태스크를 자율적으로 수행할 수 있도록 Planning, Memory, Tool-Use 로직을 설계 및 구현합니다.
하이브리드 로직 최적화: 객체 병합(Bbox Merging), 경로 추적(Tracing) 등 데이터 특징 기반의 Rule-based 전처리와 AI 모델을 결합한 하이브리드 추론 시스템을 고도화합니다.
<Track 2: 데이터 인텔리전스 모델 설계 및 구현 (0명)>
OCR 파이프라인 구축: 다양한 데이터(도면, 문서, 스캔본)에서 텍스트를 인식하고 추출하는 OCR 모델의 추론 및 학습 파이프라인 구축
Object Detection 파이프라인 구축: 다양한 데이터(도면, 사진, 문서)에서 도메인에 특화된 객체를 탐지하는 모델의 추론 및 학습 파이프라인 구축
협업 및 연동: 트랙 1, 3, 4의 작업자와 긴밀하게 협업하여 구축된 데이터 인텔리전스 모델을 데이터 레이크하우스에 연동
<Track 3: LLM 파인튜닝 및 강화학습 기반 모델 학습 (0명)>
SFT(Supervised Fine-Tuning): 오픈소스 모델을 기반으로, 지시 수행 능력 및 도메인 특화 성능 향상을 위한 파이프라인을 구축하고 학습을 수행합니다.
최신 강화학습(RL) 리서치 및 적용: 모델의 논리적 추론 능력 극대화를 위해 DPO 등 최신 강화학습 기법을 실험하고 서비스에 적용합니다.
벤치마크 평가 체계 구축: 정밀한 모델 성능 측정을 위한 자동화 평가 프레임워크를 고도화합니다.
<Track 4: 데이터 레이크하우스 아키텍처 구현 (0명)>
비정형 데이터 파이프라인 구축: 설계 도면, 기술 문서 등 대규모 비정형 데이터를 모델이 학습 및 추론할 수 있는 정제된 형태의 데이터셋으로 변환하고 적재하는 파이프라인을 구축합니다.
데이터 레이크하우스 설계: AI 에이전트와 모델 학습 환경(분산 학습 등)에서 데이터를 효율적으로 조회하고 활용할 수 있도록 확장성 있는 데이터 저장/처리 아키텍처를 구현합니다.
자격요건
컴퓨터 공학, 인공지능, 수학/통계학 등 관련 분야 학사 학위 이상 전공자 (재학/휴학/졸업생 모두 가능) 또는 그에 준하는 프로그래밍 역량을 갖추신 분
Python 및 PyTorch 등 딥러닝 프레임워크를 능숙하게 다룰 수 있는 분
최신 AI 논문의 핵심 아이디어를 빠르게 파악하고 코드로 구현해 보는 것을 즐기시는 분
정답이 없는 환경에서 주도적으로 가설을 세우고, 실험을 통해 검증하는 문제 해결 능력을 갖추신 분
동료 및 협력사와의 능동적인 커뮤니케이션을 통해 모호한 요구사항을 기술적 언어로 구체화할 수 있는 분
우대사항
[일반 우대사항]
NeurIPS, ICLR, ICML, EMNLP, ACL 등 글로벌 주요 AI 학회 논문 게재 경험
LangChain, LlamaIndex, AutoGen 등 Agentic AI 프레임워크 활용 경험
[에이전트 트랙 우대사항]
PDF, DXF, SVG 등 벡터/레이어 기반 도면 및 비정형 데이터 파싱 경험
객체 탐지(Object Detection), OCR, 그래프 기반 학습 모델 등 ML/Vision 기초 지식 보유
설계 도면 관련 기초 지식 보유 우대 (건설, 토목, 기계, 화공 부전공 등)
[데이터 인텔리전스 트랙 우대사항]
YOLO, PaddleOCR 등 최신 Object Detection 및 OCR 모델을 직접 파인튜닝하고 실무/프로젝트에 적용해 본 경험
OpenCV, Albumentations 등을 활용하여 도메인 특화(노이즈, 회전, 스캔 왜곡 등) 이미지 전처리 및 데이터 증강(Data Augmentation)을 능숙하게 다뤄본 경험
복잡한 문서(PDF)의 레이아웃 구조를 분석하고 테이블 데이터를 정형화해 본 경험
[모델 학습 트랙 우대사항]
GRPO 등 최신 LLM 강화학습 기법을 직접 적용해 본 경험
LLM 추론 최적화(vLLM, TensorRT-LLM) 및 메모리 병목 현상 해결 경험
H100/B200 등 엔터프라이즈급 서버 인프라를 다뤄 모델 Finetuning 학습을 해본 경험