버전 관리 및 협업 도구: Git, Bitbucket, Slack, Confluence, Jira, Datahub
[합류 직후 이런 일을 해요]
외부 데이터 소스 수집 및 데이터 파이프라인 구축: 외부 데이터 소스(광고 매체 등)로부터 데이터를 안정적으로 수집하기 위해 실시간·배치 데이터 파이프라인을 설계하고 자동화하여 데이터 수집 및 처리 효율을 극대화합니다
데이터 설계 및 분석 환경 제공 : 데이터 웨어하우스와 데이터 마트를 구축하여 마케팅, 그로스 등 유관 부서에서 광고 성과를 빠르고 정확하게 분석할 수 있는 환경을 제공합니다
유지보수 및 모니터링 : 광고 매체 API 스펙 변경, 인증 방식 변경, 정기 점검 등 외부 요인으로 인한 데이터 수집 이슈를 상시 모니터링하고, 파이프라인 수정 및 운영 대응을 통해 데이터 수집의 연속성을 보장합니다
문제 해결 : 광고 매체 API 호출, 인증, 응답 지연·실패 등 실시간 및 배치 데이터 수집 과정에서 발생하는 문제를 신속히 파악하고 해결합니다
[장기적으로 이런 일도 할 수 있어요]
환경 고도화 : 다양한 기술을 테스트하고 실제 운영 환경에 적합성을 검증하여 최적화된 환경을 구성, 효율성을 향상시킵니다
대용량 데이터 처리 : 데이터 처리 시스템을 설계하여 데이터 전송, 저장, 분석 과정의 성능을 최적화합니다
MLops 관리 : 머신러닝 모델의 배포 및 운영 환경을 관리하여 안정적인 모델 서빙과 운영을 지원합니다
자격요건
경력 1~3년 또는 이에 준하는 역량을 갖추신 분
카카오, 구글 등 광고 매체 API를 활용한 데이터 수집 및 연동 경험이 있는 분
Python, Shell Script 등 하나 이상의 프로그래밍 언어를 능숙하게 다루시는 분
데이터 수집, ETL / ELT 파이프라인 설계, 구축 및 운영에 대한 경험이나 이에 준하는 지식을 보유하신 분
데이터베이스에 대한 이해를 바탕으로 분석 목적에 맞게 테이블 설계 및 모델링이 가능하시거나 이에 대한 높은 관심을 보유하신 분
SQL을 활용해 데이터를 분석하고, 수집된 데이터의 정합성을 검증할 수 있는 분
우대사항
데이터의 정확성과 품질 향상을 위한 분셕력을 겸비하신 분
배치 작업 스케줄링 및 데이터 파이프라인 운영 과정에서 발생하는 이슈를 파악하고 개선해본 경험이 있거나, 이에 대한 이해가 있는 분
클라우드 환경(GCP or AWS) 및 컨테이너/클러스터 기술(Kubernetes 등)에 대한 이해 또는 경험이 있는 분
새로운 기술이나 도메인 변화에 관심을 토대로 팀 역량 강화에 기여해 본 경험이 있으신 분
기본적인 네트워크, 인프라에 대한 이해도가 있으신 분
대용량 데이터 또는 실시간 데이터 처리 환경에 대한 이해와 관심을 가지고 계신 분
[미래의 동료에게 드리는 한 마디] 안녕하세요, DataOps Team Leader Wilk 입니다. 현재 4명으로 이루어진 저희 팀은 회사의 다양한 부서에 필요한 데이터와 이를 활용하기 위한 환경을 제공하는 역할을 수행하고 있습니다. 숨고 서비스의 성장과 함께 카카오·구글 등의 다양한 광고 매체를 포함한 외부 데이터 규모와 복잡도가 빠르게 증가하면서 마케팅 의사결정에 활용되는 광고 성과 데이터에 대해 정확성 ·신뢰성·지속적인 수집 안정성에 대한 요구도 함께 높아지고 있습니다. 이에 따라 저희 팀은 광고 매체 API 기반 데이터 수집부터 파이프라인 구축과 운영, 매체 변경 및 점검에 따른 모니터링과 문제 대응, 그리고 다양한 부서에서 광고 데이터를 효과적으로 활용할 수 있는 데이터 설계와 제공까지 전반적인 흐름을 함께 고민하고 개선해 나갈 동료를 찾고 있습니다. 저희와 함께 할 여러분을 기다리고 있겠습니다.