병원 개/폐업 분류 예측 경진대회

병원 개/폐업 분류 예측 대회 1위 수상자 인터뷰 ("MooSub" 팀)

2019.12.04 15:34 1,166 조회

우승자 사진

2차 대회 1위 수상자인 MooSub 팀 인터뷰를 공유합니다. 


 

수상을 진심으로 축하합니다. 수상 소감 부탁드립니다.

감사합니다. 공부를 목적으로 시작했지만 우승까지 해서 기분이 좋습니다.
 
데이터 분석에 관심을 가지게 된 계기나 데이터 분석 일을 하게 된 이유가 있다면 무엇인가요?

앞으로 데이터분석으로 미래에 대한 예측과 그 예측을 활용하는 것이 핵심적일 것이라고 생각합니다.
또 더 나아가서 인공지능이 그 것을 조금 더 정확하게 발전시킬 수 있다고 생각합니다.
그래서 흥미를 갖기 시작했고 공부하기 시작했습니다.


데이콘 경진대회에 참여한 동기가 있나요?

참여한 동기는 실력 향상입니다. 실제로 머신러닝과 딥러닝을 공부하면서 병행했습니다.

 


학업이나 현업 그리고 일상생활과 관련해서 대회 중 느낀 점이 있다면 무엇입니까?

분석했던 것은 병원데이터 였지만 이거와 연결하여 기업에 대한 예측, 음식가게에 대한 예측 등 일상생활에서 활용 할 가능성이 충분하다고 생각합니다.
또 4번 대회와 같은 집값 예측 역시 분석에 성공한다면 일상생활과 연결 할 수 있을 것 같습니다.
 

대회에 참여하면서 어려웠던 점이 있다면 무엇일까요? 

데이터 수가 적어서 모델 학습이 힘들었고 추석 기간이 껴있어서 일정 관리도 어느정도 해야했습니다.

데이콘에 더 바라는 점, 기대 사항이 있다면 무엇입니까? 

2번대회 test 데이터를 보면 같은 값을 가진 데이터가 3개(총 6개)가 있습니다.
그 중에서 23번 24번 같은 경우에는 병원 종류를 제외한 모든 값이 똑같은데 하난 open이고 나머진 close 였습니다.
이것이 만약 train 데이터였다면 이상치로 제거하면 상관없지만 예측해야 할 데이터에 이상치가 있다는 것은 좀 의아했습니다.

 또 2번대회 데이터 OC 부분이 'open'과 ' close' 인것처럼 공백이 들어가 있다는 것과 3번 Auction_rent데이터의 key이름이 'Auctiuon_key'로 u하나가 추가된 것과 같이
디테일한 부분이 좀 아쉬웠습니다.

대회 제출기간이 끝나고부터의 진행사항을 알 수 있었으면 더 좋을 것 같습니다.
2주가 연기된 시점부터 어떤 진행과정이 있는지 알 수 없어서 조금 불편했습니다.