퇴근시간 버스승차인원 예측 AI 경진대회

제주 퇴근시간 버스 승차인원 예측 모델 1위 수상자 인터뷰 (제주감귤)

2020.01.16 15:21 1,095 조회

제주 퇴근시간 버스 승차인원 예측 모델

전공분야(학력)

최승희: 국민대학교 빅데이터경영통계전공

이채연: 국민대학교 빅데이터경영통계전공

류예나: 국민대학교 빅데이터경영통계전공

남윤주: 국민대학교 빅데이터경영통계전공

황태용: 국민대학교 빅데이터경영통계전공


수상을 진심으로 축하합니다. 수상 소감 부탁드립니다.

감사합니다! 사실 데이콘 경진대회와 학업을 병행하느라 어려움이 많았습니다. 그렇지만 바쁜 시간을 쪼개가며 열심히 할 수 있게 만든 원동력은 흥미를 잃지 않는 것과 열정적인 팀원들 덕분이었습니다. 데이콘에서 좋은 경험을 할 수 있어 의미 있는 2019년으로 한 해를 마무리 할 것 같습니다. 또 이 상을 받을 수 있도록 저희에게 많은 지식을 알려주시고 항상 학생들을 사랑으로 아껴주시는 교수님들께 감사하다는 말씀 드리고 싶습니다. 또한 좋은 대회의 장을 마련해주시고 한국의: 데이터 사이언스 발전에 노력을 기울어주시는 Dacon과 제주테크노파크에게도 감사를 전합니다.


데이터 분석에 관심을 가지게 된 계기나 데이터 분석 일을 하게 된 이유가 있다면 무엇인가요?

학교에서 데이터 분석에 관해 배우면서 방대한 양의 정보가 쏟아지고 있는 정보의 바다 속에서 목적에 맞는 필요한 데이터를 수집, 저장하고 가공하는 것은 매우 중요하다고 생각합니다. 그렇기 때문에 더더욱 체계적이고 전문적인 지식을 가지고 데이터 분석을 해야한다고 생각했고, 데이터 분석 분야에 대해 관심을 갖게 되었습니다. 또한, 데이터를 활용해서 창출할 수 있는 가치가 무궁무진 하다는 점도 데이터분석에 관심을 갖게 해주었습니다. 이번 대회에서 처럼 사회적으로도 기여할 수 있고 인공지능, 머신러닝 등을 통해 우리의 삶을 변화시킬 수 있다는 가능성이 저희가 데이터 분석을 즐거워하는 이유입니다.


데이콘 경진대회에 참여한 동기가 있나요?

저희 팀은 국민대학교에서 '빅데이터'를 공부하고 있는 3, 4학년 학생들로 구성되어 있습니다. 학교라는 울타리를 넘어 저희의 실력을 증명해보고 싶어서 대회에 참전하게 되었습니다. 학교에서 배운 내용은 사실 가공이 완료된 데이터들이 많아서 실무에서 쓰는 가공되지 않은 데이터를 처리해보고 싶었습니다. 실제 제주도 버스 데이터를 가지고 실제 데이터는 어떻게 생겼으며, 현실적으로 어떤 작업이 필요한지 알아가면서 실무적인 역량을 기르고 싶어 이 대회에 참가하게 되었습니다.


학업이나 현업 그리고 일상생활과 관련해서 대회 중 느낀 점이 있다면 무엇입니까?

일상 생활을 하면서 사람들은 버스 어플을 많이 이용합니다. 제주도 버스의 효율적인 운행 뿐만 아니라 전국적으로 각 일자, 노선, 정류장 별로 승차 인원을 예측하여 미리 알려줄 수 있다면 우리 삶에 많은 도움이 될 것 같습니다.

또한 학업에서 배운것과 실제로 차이가 많다고 느꼈습니다. 학업에서 배운 여러가지 기법을 적용해봤지만 성능이 올라가지 않을 때도 많았습니다. 기술적인 지식도 물론 중요하지만, 도메인에 대한 배경지식또한 필요하다고 느꼈습니다.


대회에 참여하면서 어려웠던 점이 있다면 무엇일까요?

생각보다 모델을 만드는데 사용된 데이터의 발생 기간이 짧다는 것이 일반화된 모델을 만들 때 많은 고민을 주었습니다. 오버피팅이 발생하지 않도록 주의하면서 모델을 만들어야 했습니다. 또한 성능을 테스트 해 볼 기회가 하루 3번이라는 것이 제한적이었습니다.


데이콘에 더 바라는 점, 기대 사항이 있다면 무엇입니까?

1) 자유롭게 경진대회 별로 Discussion을 할 수 있는 공간이 있었으면 좋겠습니다.


2) Kaggle과는 달리 국내 데이터를 다뤄볼 수 있다는 점이 데이콘의 매력인 것 같습니다. 최근 Text, Image와 관련된 경진대회들도 많이 올라오고 있어서 매우 흥미롭습니다. '추천시스템'과 관련된 경진대회도 있으면 흥미로울 것 같습니다


설문(인터뷰)에 없는 내용 중 더 하고 싶은 말이 있나요?

Kaggle과 같은 데이터 관련 경진대회 플랫폼이 되기 위해서는 더 많은 상금과 상품이 있으면 좋을 것 같습니다 ! Korean Data Science 화이팅 !