📨 [뉴스레터 1호] 데이콘의 새로운 시도, 뉴스레터!

2023.02.23 15:51 743 조회

안녕하세요, 데이커 여러분! 🙌

지난 2월 13일 월요일에 이미 메일함에서 소식을 확인한 데이커분들도 있으실 텐데요.

바로바로, 경진대회 맛집인 데이콘에서 새롭게 뉴스레터를 발행하기 시작했습니다!


오직 데이콘에서만 볼 수 있는 수상자 솔루션과 데이커들의 이야기, 그리고 데이콘 팀의 tmi까지.

유익하고 재미있는 내용으로 알차게 채워 볼게요!

많은 기대 부탁드립니다! 🤓



데이콘 뉴스레터는 2주에 한 번, 월요일에 찾아갑니다!
뉴스레터를 메일함으로 곧장 받아 보고 싶다면, 
‘내 계정 관리’ 하단, 마케팅 정보 수신 동의에 체크해 주세요!


🕺 수상자 솔루션

감귤 착과량 예측 AI 경진대회


지난 연말, 데이콘 대회 페이지에서 싱그러운 이미지로 눈길을 끌었던 🍊감귤 착과량 예측 대회 수상자의 솔루션을 소개합니다!

🔍 여기서 잠깐,

제주도하면 떠오르는 과일은? 바로 감귤이죠! 🍊

지리적인 특성상 다양한 작물을 재배하기 힘든 제주도에선 감귤이 큰 역할을 했는데요! 하지만 다양한 과일이 수입되고, 그에 따라 감귤의 가격 경쟁력도 약해지면서 생산 혁신이 필요하다는 목소리가 해마다 커지고 있습니다. 때문에 계획적인 생산 관리는 제주도 감귤 농업 분야의 큰 숙제 중 하나입니다.


생산 계획을 세우고 이를 관리하기 위해서는 다음 해 감귤이 얼마나 재배될지 예측하는 생산량 추정✨이 필수적인데요.

보통 감귤 생산량을 추정할 때는 조사 인력이 감귤밭을 직접 눈으로 보고 기록하는 관측 조사를 하는 경우가 많습니다. 그러나 한정된 조사 인력이 약 22,000ha에 이르는 방대한 면적을 살펴보아야 하는 탓에, 인력 부족뿐 아니라 일관되지 않은 데이터가 수집되는 문제가 발생하고 있습니다.


데이콘에서 진행한 감귤 착과량 예측 경진대회는 감귤 나무의 생육 상태, 엽록소, 새순 정보로부터 감귤 착과량을 예측하는 AI 모델을 개발하여 이러한 문제를 해결하고자 했는데요!

과연 어떤 솔루션이 나왔을까요? 본격적으로 1위, dxi 팀의 솔루션을 살펴보겠습니다! 👀




1. 논리적 정보를 통한 가설 수립

데이콘이 제공한 데이터의 도메인 지식을 탐구하여 가설을 세웠습니다.

감귤나무의 나무 생육 상태, 엽록소 및 새순 정보와 착과량(열매)에 대해 음의 상관관계와 양의 상관관계가 존재할 것이라는 가설을 설정하였습니다.



2. EDA(탐색적 데이터 분석)

앞에서 세운 가설을 검증하기 위해 데이터의 분포와 상관관계를 확인했습니다.

이 과정에서 착과량과 큰 연관성이 없다고 판단된 엽록소의 시계열 및 파생변수들이 분석에 활용할 변수에서 제외되었습니다.



3. 모델링 & 튜닝

학습 데이터를 7:3 비율로 나누어 모델의 성능을 검증했습니다.

여러 회귀 알고리즘 모델들에 각각 하이퍼 파라미터 튜닝을 진행한 결과, 가장 성능이 좋았던 Random Forest Regressor 모델과 파라미터(n_estimators, max_depth) 조합으로 최종 예측에 사용할 변수를 찾는 Feature Selection 실험을 진행했습니다.



4. 예측

3의 실험 결과를 종합하여 시험 데이터에 대한 착과량 예측을 진행했습니다.

그 결과, Private Score 기준 NMAE 0.07224로 1위를 기록하였습니다.



이번 대회에서 공유된 코드들을 보면, 많은 참가자들이 Auto ML을 사용했다는 것을 알 수 있는데요.

dxi 팀은 직접 RandomForest 모델의 튜닝만 진행한 점이 다른 참가자들과의 차별점이라고 생각됩니다! 👏




이번 대회는 이런 점이 독특했어요!


⏰ 바쁘다 바빠, 짧은 일정!

감귤 착과량 예측 AI 경진대회는 2022년 12월 12일 10:00에 시작해 12월 14일 10:00 종료되었어요!

날짜로 따지자면 3일이지만 실제로는 이틀, 48시간 동안 진행되었는데요! 🙀 촉박한 일정이었음에도 총 303팀이 참여하며 데이커들에게 짧지만 강렬한 인상을 남겼습니다.


🏁 끝날 때까지 끝난 게 아니다.

대회에 참여한 적이 있는 데이커라면 모두 잘 알겠지만, 대회 기간 중 수시로 확인할 수 있는 Public 등수와 대회 종료 후 공개되는 Private 등수가 꼭 일치하는 건 아닙니다!

Public 점수가 1위라도 안심할 수 없는 이유죠!

어떤 대회든 그렇지만, 이번 대회는 특히 순위 변동이 많았어요. 💫


> 더 많은 참가자들의 솔루션이 궁금하다면? <




🎙️ 데이커 인터뷰


데이콘에 모인 모두에겐 각자의 스토리가 있죠! '데이커 인터뷰'는 독특한 이력을 가진 데이커를 선정하여 소개해 드리는 코너입니다.

이번 뉴스레터에서는 감귤 착과량 예측 대회 1등 솔루션의 주인공인 dix 팀, 이종수 님의 인터뷰 일부를 소개해 드릴게요!


🎙 수상을 진심으로 축하드립니다. 수상 소감을 말해 주세요.

경진 대회에 참여해서 수상을 할 수 있어서 대단히 영광스럽게 생각하고 있습니다. 짧은 대회 기간 동안이었지만, 다양한 모델과 알고리즘을 적용해 보면서, 의미 있는 결과를 도출할 수 있었습니다. 또한 개인적으로 '과수'라는 도메인에 관심이 있어, 금번 대회를 진행하는 데 많은 도움이 되었던 것 같습니다. 마지막으로 본 대회에 참가하신 모든 분들께 수고하셨다는 말을 전해드리고 싶습니다. 감사합니다.


🎙 데이터 분석에 관심을 가지게 된 계기나 데이터 분석 일을 하게 된 이유가 있다면 무엇인가요?

2020년을 기점으로 이전 10년은 시스템 구축 및 업무 효율을 통한 운영 생산성/효율성 향상이었다고 하면, 앞으로의 10년은 이러한 기간계 시스템들로부터 생성된 데이터를 분석하고, 기업의 의사 결정에 필요한 인사이트 및 다양한 솔루션을 제공하는 것이 기업의 핵심 업무라고 생각하고 있습니다. 이러한 이유로 빅데이터 분석 업무에 관심을 가지게 되었습니다.


🎙 학업, 현업, 일상생활 등과 관련해서 대회 중 느낀 점이 있나요?

시간이 다소 부족한 부분이 있었지만, 취미 생활을 할 때 느끼는 열정을 가지고 재미있게 대회를 참여할 수 있어서 즐거웠습니다.



> 이후 내용은 데이콘 홈페이지 ‘우승자 인터뷰’에서 확인하세요! <




🤩 데이콘 지금은


제1회 코스포x데이콘 자동차 충돌 분석 AI경진대회가 열렸습니다!

대회 초반인데도 참가자들의 열기가 무척 뜨거운데요.🔥 특히나 이번 대회는 채용 연계형으로, 우수한 성적을 거둔 참가자는 스타트업에 추천된다는 점에서 그 결과가 더욱 주목됩니다.

이번 자동차 충돌 분석 경진대회는 오는 3월 13일(월) 종료되며, 최종 수상자는 3월 27일(월) 발표됩니다!

마지막까지 많은 관심 부탁드립니다! 🚘




📢 업데이트 소식

살기 좋은 도시, 🏡 보스턴 집값 예측 프로젝트가 오픈되었어요!




에디터 한마디 💬

colab을 더 귀엽게 사용하는 방법, 알고 계셨나요?

‘도구>설정>기타’에서 강아지와 고양이, 게를 선택하면 화면 상단에 동물 친구들이 뛰논답니다! 🐾 (옆자리 DS 팀원분이 알려 주셨어요!)

그럼, 데이커 여러분! 다음 뉴스레터에서 만나요! 🙌