2021 농산물 가격예측 AI 경진대회

2021 농산물 가격예측 AI 경진대회 수상자 인터뷰 _ Team HIT

2022.01.05 17:19 2,265 Views

2021 농산물 가격예측 AI 경진대회

🎉 Team HIT 님, 수상을 진심으로 축하합니다. 🎉

 

🏆 hector21 오승환님(KT / 경영학 석사)

      Mymapsi 곽정애님(한국발명진훙회 / 컴퓨터공학 박사)

 

 

🎙세 우승팀 중 한 팀이 되었는데요, 수상을 진심으로 축하드립니다. 수상 소감 부탁드립니다.

hector21

회사에서 데이터사이언티스트 업무를 하고 있고, 대학원에서도 인공지능, 빅데이터를 배웠는데요, 많은 능력자들이 참여한 대회에서 수상을 하게 되어 정말 기쁩니다.

상당히 긴 대회 기간 동안 힘들기도 하였지만 하루하루가 설레고 재미있었습니다. 좋은 대회를 만들어주신 Dacon과 한국농수산식품유통공사에 감사드립니다.

Mymapsi

21년 8월 서강대학교 경영전문대학원 AI MBA을 졸업하고, 저의 실력을 측정해 보기 위해 참가해 본 대회에서 수많은 경쟁을 뚫고 최우수상을 받게 되어 너무너무 기쁩니다. 

본 대회에서 AI MBA과정에서 교수님들께서 교육해 주신 지식이 하나도 버릴 것이 없다는 것을 다시 한번 느끼게 되었습니다.

또한 주옥 같은 코드와 데이터들을 공유해 주신 주관 및 주최기관의 관계자분들께 정말 감사의 말씀을 전하고 싶습니다. 다른 대회보다도 애착을 갖고 이 대회를 진행하고 계시다는 느낌을 팍팍 받을 수 있었어요.

마지막으로 이번 대회를 계기로 다시 한번 데이터 분석 전문가로 나아갈 수 있도록 함께해 주신 오승환 팀장님께 감사의 마음을 전하고 싶습니다.


🎙데이터 분석에 관심을 가지게 된 계기나 데이터 분석 일을 하게 된 이유가 있다면 무엇인가요?

hector21

경력 초기부터 데이터웨어하우스와 빅데이터 플랫폼 개발을 했었습니다. 인공지능/딥러닝 기술이 급부상하면서 데이터를 가지고 할 수 있는 많은 일들에 다시 한번 관심을 가지게 되었고, 데이터분석 업무를 하게되었습니다.

Mymapsi

저는 학부때부터 데이터베이스를 무지 사랑했습니다. 왜냐하면 정보를 데이터화해서 모아두면 다양한관점에서 분석이 가능하기 때문이죠.

특히 RDBMS에서 QUERY로 유의미한 데이터를 추출하고, 분석해서 현업에 적용하는 업무는 정말 재미있습니다.

또한 좀더 깊이 있는 분석을 위해 통계를 독학으로 공부해서 데이터베이스에서 뽑은 데이터를 갖고 상관분석, 다중회귀분석모델을 구축하여 현업에 적용해 보기도 했습니다.

항상 업무를 하면서 “누가 이렇게 말했어요” 보다 “데이터가 이렇게 말하고 있어요” 주장하는 것을 무지 중요하다고 주장하면서, 지금도 저는 데이터의 바다에 빠져 있습니다.


🎙데이콘 경진대회에 참여한 동기가 있나요?

hector21

데이콘에서 제공하는 실제 데이터에 제가 학습하고 활용하고 있는 머신러닝과 딥러닝 기술을 적용해보고 싶었습니다. 그리고 우리나라의 데이터 전문가들과 같이 경쟁하면서 제 역량을 평가해보고 싶었습니다.

Mymapsi

서강대학교 AI MBA를 졸업하고, 다시 데이터 분석하고 멀어져 버리는 느낌이 들었습니다. 하지만 마음속으로는 데이터 분석을 계속 할 수 있는 길을 찾던 중 데이콘 경진대회를 알게 되었어요.

지난 경진 대회의 수상자의 코드를 보면서, 저의 실력을 측정해 보고 싶었습니다. 피터 드러커는 “측정할 수 없으면 관리할 수 없고, 관리할 수 없으면 개선시킬 수 없다”고 말했습니다.

데이콘은 저의 실력을 측정해 볼 수 있는 플랫폼으로 삼을 수 있을 것이라는 판단에 참가하게 되었습니다.


🎙학업, 현업, 일상생활 등과 관련해서 대회 중 느낀 점이 있나요?

hector21

데이콘의 많은 대회들을 보면서 인공지능, 빅데이터 분야가 참 넓다는 생각을 많이 하고 있습니다. 올해는 시계열 예측 대회에 참가했는데요, 내년에는 이미지 인식, 텍스트 분석 등 딥러닝을 활용하는 대회에도 참가하려고 생각하고 있습니다.

Mymapsi

이번 대회는 데이터 분석은 양도 중요하지만 수 많은 데이터 중에서 의미를 부여할 수 있는 정보를 찾는 것이 더 중요하다는 것을 알게 해 준 대회입니다.

농산물 거래 데이터에는 수많은 농산물이 있으며, 또한 기후 정보도 평균, 누적 등 다양하게 가공해서 제공되는 데이터의 양도 어마어마 했습니다. 그 중에 농산물 가격에 영향을 주는 강수량과 무역수지 정보를 뽑기 위해 수많은 탐색적 분석을 해야 했습니다.

이를 통해 빅데이터 시대에 모든 정보가 우리에게 유의미한 결과를 보여주지 않는다는 것을 알게 되었습니다. 빅데이터 안에 숨어 있는 구슬을 찾는 것이 데이콘을 사랑하는 데이터 분석가의 역할이 아닌가 싶습니다.


🎙대회에 참여 중 어려운 점이 있었나요? (일정 관리, 분석 방법론 등)

hector21

매일 결과를 제출해야 해서 중간에 지친다는 생각도 들었습니다. 제대로 제출했는지 우려도 됐고요. 하지만 약간의 긴장감도 좋았고, 하루하루가 설레고 재미있었습니다. 분석방법론은 대학원 석사과정에서 배운 시계열 분석/예측기법들을 활용할 수 있었습니다.

Mymapsi

기후정보와 무역수지 정보를 추출하기 위해 공공데이터 포털에서 제공하는 API를 사용했습니다. 그런데 하루에 포털에 연결할 수 있는 트래픽 제한이 있다 보니,

초기 프로그램 구현 및 테스트 시기에는 제한에 걸려 프로그램 테스트를 못하게 되어 초초한 마음을 갖게 된 사항이 기억나네요.

또한 COLAB에서 구현하다 보니 GPU 사용 제한으로 모델 구축시 자주 끊김 현상이 있어 매우 힘들었습니다.

이 모든 것이 활용할 수 있는 자원의 한계에서 겪은 어려움이었습니다.


🎙데이콘에 기대사항이 있나요?

hector21

 앞으로도 좋은 대회들을 많이 만들어주시면 감사하겠습니다.

Mymapsi

앞으로도 농산물 가격 예측 AI 경진대회처럼 고급 코드와 데이터를 다를 수 있는 대회가 많이 개최되었으면 좋겠습니다.

데이콘의 경쟁력은 리더보드를 통한 실력 측정의 적시성입니다. 자신의 실력을 바로 측정해 봄으로써 계속해서 도전할 수 있는 동기가 되고 있다. 앞으로도 AI 전문가를 꿈꾸는 많이 이들에게 데이콘을 많이 많이 소개할 것입니다!