회사명	래브라도랩스
포지션	파이썬 기반 데이터 크롤링 및 정제 담당자
근무지	서울특별시 서초구 반포대로 20, 3,4층
고용형태	정규직
경력	5년 이상
지원 마감	2026-05-31
기술 스택	Git, Linux, MySQL, C / C++, HTML, Java, Python, AWS, Docker, CSS3

회사 소개

래브라도랩스는 최근 Series B 143억원 투자유치 완료하였습니다.
래브라도는 오픈소스 소프트웨어들이 갖고 있는 알려진 취약점(CVE)을 수집하여, 고객이 구현한 소프트웨어에 어떠한 보안 취약점이 있는지를 분석하고 해결방안을 제시해 주는 서비스입니다.

이번 채용은 다양한 웹 서비스로부터 비정형 데이터를 수집(Crawling/Scraping)하고, 분석 및 모델링이 가능한 형태의 고품질 데이터 세트로 정제(Cleaning)하는 프로세스를 구축합니다. 효율적이고 안정적인 데이터 파이프라인 운영을 통해 비즈니스 인사이트 도출의 기초를 마련하는 역할을 수행합니다.

주요 업무

* 데이터 수집 체계 구축: Python을 활용하여 국내외 오픈소스, 라이선스, 취약점, 등의 데이터를 수집하는 스크래퍼 개발 및 유지보수
* 데이터 정제 및 가공: 수집된 비정형 데이터(HTML, JSON 등)의 노이즈 제거, 텍스트 정규화, 결측치 처리 및 구조화
* 크롤링 자동화 및 모니터링: Airflow 등을 활용한 수집 스케줄링 관리 및 사이트 구조 변경에 따른 장애 대응 모니터링 시스템 운영
* 우회 기술 적용: 차단 정책 대응을 위한 Proxy 활용, User-Agent 최적화, 동적 페이지 렌더링 처리

자격요건

* Python 숙련도: Pandas, NumPy 등 데이터 핸들링 라이브러리 활용 능력
* 크롤링 프레임워크 경험: BeautifulSoup, Scrapy, Selenium, Playwright 중 1개 이상의 실무 경험
* 웹 기술 이해: HTML5, CSS Selector, XPath, JavaScript, HTTP 통신(REST API)에 대한 깊은 이해
* 데이터베이스 활용: MySQL, PostgreSQL 등 RDBMS 또는 MongoDB와 같은 NoSQL 활용 경험

우대사항

* 오픈소스 생태계: 오픈소스, 라이선스, 취약점에 대한 기본 지식 보유자
* 대규모 데이터 처리: 분산 크롤링 환경 구축 경험자
* 인프라 활용: AWS 등 클라우드 환경 및 K8S, Docker 컨테이너 기반 배포 경험
* 언어 모델 활용: KoNLPy 등 자연어 처리(NLP) 라이브러리 활용 경험 혹은 LLM을 활용한 데이터 라벨링 자동화 경험
* 윤리 의식: Robots.txt 준수 및 데이터 수집 관련 법적 리스크에 대한 기본적인 이해