[정보] 데이터를 활용하는 대표적인 직군을 소개합니다.

2022.02.06 17:43 1,527 조회


하단의 모델 개발 프로세스를 보면, 데이터 및 머신러닝과 관련해 다양한 직군이 있음을 알 수 있는데요.

데이터 수집부터 모델 제공 및 최종 사용자 인터페이스에 이르기까지 다양한 직군이 협업하고 있습니다.


다양한 직군의 협업으로 이뤄지는 머신러닝 모델 개발 프로세스



오늘은 데이터 분야에서 종사하고 있는 여러 직군을 소개해보도록 하겠습니다.

데이터 직군을 크게 나누어 보자면 데이터 엔지니어, 데이터 분석가, 데이터 사이언티스트, 머신러닝 엔지니어로 구분할 수 있습니다.



01. 데이터 엔지니어 (Data Engineer)

데이터 엔지니어는 조직의 데이터를 위한 인프라와 워크플로를 관리합니다.

이들은 데이터 수집 및 파이프라인 구축, 그리고 데이터를 저장하고 전송하는 방법을 관리하는 데 도움을 줍니다.

데이터 엔지니어는 데이터를 중심으로 인프라와 파이프라인을 구현합니다.


02. 데이터 분석가 (Data Analyst)

데이터 분석가는 데이터를 분석하고 인사이트를 도출하여, 조직 내에 공유합니다.

SQL이나 스프레드 시트에서 작업하고, 비즈니스 인텔리전스 도구를 사용하여 데이터를 시각화하여 결과를 공유합니다.


주로 제품 팀과 긴밀히 협력하여, 비즈니스 문제를 해결하고 가치를 창출하는 데 도움을 줍니다.

보통은 기존의 데이터 추세를 식별하고 그로부터 인사이트를 도출하는 데 집중하지만,

그 뿐만 아니라 데이터를 통해 향후 예측을 만드는 데에도 관심을 갖습니다.


03. 데이터 사이언티스트 (Data Scientist)

데이터 사이언티스트는 데이터셋 수집 및 해석, 처리를 수행하는 직군으로 데이터에 대한 통계적, 탐색적 분석을 수행합니다.

또한, 데이터 수집, 특징 가공, 모델 구축 등의 작업을 하며 일반적으로 조직의 머신 러닝 모델을 가장 먼저 구축한다고 볼 수 있습니다.


04. 머신러닝 엔지니어 (Machine Learning Engineer)

머신러닝 엔지니어는 모델에 대해 데이터 엔지니어와 유사한 작업을 수행합니다.

데이터 사이언티스트가 개발한 모델을 가져와 모델 학습 및 배포와 관련된 인프라와 운영을 관리합니다.


즉, 모델 버전 관리 및 업데이트를 수행하고, 서비스에 적용하여 최종 사용자에게 예측 서빙을 처리하는 프로덕션 시스템을 구축합니다.



이때, 데이터 분석가와 데이터 사이언티스트의 직무가 유사해보이는데요.

아직 해외에 비해, 국내의 경우 데이터 직군의 경계가 비교적 모호한 것은 사실입니다만,

채용 공고 등을 통해 비교해보자면 다음과 같이 구분할 수 있습니다.


데이터 분석가 : 상관 분석, 코호트 분석 등의 통계 기반 모델을 구축 및 분석하는 업무 수행

데이터 사이언티스트 : ML, AI 기반의 모델을 구축 및 분석하는 업무를 수행



따라서, 데이터 사이언티스트는 데이터 분석가 관점에서 본다면 개발자보다는 연구자적 성향이 강하며,

데이터 엔지니어 관점에서 머신러닝 엔지니어는 연구자에 가까운 개발자라는 표현이 적절하다고 볼 수 있겠습니다.


.

.

.


Reference

[1] 머신러닝 디자인 패턴, 한빛미디어

[2] https://github.com/Team-Neighborhood/I-want-to-study-Data-Science/wiki/데이터-분야의-직군-소개

[3] https://brunch.co.kr/@itschloe1/38


  • 아직 배우는 입장으로 부족한 점이 많습니다. 수정해야하거나, 추가해야할 점이 있다면 댓글로 조언 부탁드립니다.
  • 본 게시글은 데이콘 서포터즈 ‘데이크루’ 1기 활동의 일환입니다.