페이지를 불러오는 중...
페이지를 불러오는 중...

| 회사명 | 래브라도랩스 |
|---|---|
| 포지션 | 파이썬 기반 데이터 크롤링 및 정제 담당자 |
| 근무지 | 서울특별시 서초구 반포대로 20, 3,4층 |
| 고용형태 | 정규직 |
| 경력 | 5년 이상 |
| 지원 마감 | 2026-05-31 |
| 기술 스택 | Git, Linux, MySQL, C / C++, HTML, Java, Python, AWS, Docker, CSS3 |
래브라도랩스는 최근 Series B 143억원 투자유치 완료하였습니다.
래브라도는 오픈소스 소프트웨어들이 갖고 있는 알려진 취약점(CVE)을 수집하여, 고객이 구현한 소프트웨어에 어떠한 보안 취약점이 있는지를 분석하고 해결방안을 제시해 주는 서비스입니다.
이번 채용은 다양한 웹 서비스로부터 비정형 데이터를 수집(Crawling/Scraping)하고, 분석 및 모델링이 가능한 형태의 고품질 데이터 세트로 정제(Cleaning)하는 프로세스를 구축합니다. 효율적이고 안정적인 데이터 파이프라인 운영을 통해 비즈니스 인사이트 도출의 기초를 마련하는 역할을 수행합니다.
* 데이터 수집 체계 구축: Python을 활용하여 국내외 오픈소스, 라이선스, 취약점, 등의 데이터를 수집하는 스크래퍼 개발 및 유지보수
* 데이터 정제 및 가공: 수집된 비정형 데이터(HTML, JSON 등)의 노이즈 제거, 텍스트 정규화, 결측치 처리 및 구조화
* 크롤링 자동화 및 모니터링: Airflow 등을 활용한 수집 스케줄링 관리 및 사이트 구조 변경에 따른 장애 대응 모니터링 시스템 운영
* 우회 기술 적용: 차단 정책 대응을 위한 Proxy 활용, User-Agent 최적화, 동적 페이지 렌더링 처리
* Python 숙련도: Pandas, NumPy 등 데이터 핸들링 라이브러리 활용 능력
* 크롤링 프레임워크 경험: BeautifulSoup, Scrapy, Selenium, Playwright 중 1개 이상의 실무 경험
* 웹 기술 이해: HTML5, CSS Selector, XPath, JavaScript, HTTP 통신(REST API)에 대한 깊은 이해
* 데이터베이스 활용: MySQL, PostgreSQL 등 RDBMS 또는 MongoDB와 같은 NoSQL 활용 경험
* 오픈소스 생태계: 오픈소스, 라이선스, 취약점에 대한 기본 지식 보유자
* 대규모 데이터 처리: 분산 크롤링 환경 구축 경험자
* 인프라 활용: AWS 등 클라우드 환경 및 K8S, Docker 컨테이너 기반 배포 경험
* 언어 모델 활용: KoNLPy 등 자연어 처리(NLP) 라이브러리 활용 경험 혹은 LLM을 활용한 데이터 라벨링 자동화 경험
* 윤리 의식: Robots.txt 준수 및 데이터 수집 관련 법적 리스크에 대한 기본적인 이해
Git Linux MySQL C / C++ HTML Java Python AWS Docker CSS3
이 포지션에 관심이 있으신가요?
래브라도랩스서류전형 - 1차 면접 - 2차 면접 - 최종 합격
래브라도랩스에서 래브라도랩스 - 파이썬 기반 데이터 크롤링 및 정제 담당자 포지션을 찾고 있어요
