분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
전기차 가격 예측 해커톤: 데이터로 EV를 읽다!
[인터뷰] 최종 3위, 수상 소감
: 최종 Private 순위가 5위라서 높은 순위에 만족하고 있었는 데, 최종적으로 3위를 하게 되어서... 조금 얼떨떨하다는 생각이 들었습니다.
이번 대회에서는 다양한 컬럼 중에서 '모델'과 '차량 상태'이라는 기준이 있었기 때문에 이 컬럼들을 활용하여 모델 및 차량 상태를 기반으로 배터리 용량과 주행거리 사이의 관계를 파악하여 주행거리의 범위를 확인할 수 있었고, 결측치의 평균을 채워넣을 때, 많은 도움이 되었습니다.
주로 데이터 분석과 학습 과정에서는 아래와 같이 기본적인 과정을 거쳐서 최대한 점수를 올릴 수 있도록 합니다.
데이터 불러오기 >> 결측치 확인 및 처리 >> 스케일러 >> 컬럼 Drop >> 모델 학습 >> 제출
이상치에 대한 제거 없이 스케일러 선정, 모델 선택까지 최대한 점수를 끌어올렸다고 판단되었다면 그때부터 이상치 제거에 대한 데이터의 세밀한 분석이 들어갑니다.
이상치 제거 과정에서는 너무 많은 데이터에 대한 제거는 Public 데이터에 대해서 과적합이 일어날 수 있기 때문에 최대한 제거하지 않는 선에서 Public 점수에 대한 욕심을 내지 않으려고 노력하고 있습니다. 따라서 적절한 순위 혹은 점수가 되었다고 판단되면 일시적으로 중단하고 다시 처음으로 돌아와 빠진 것이 없나 확인하는 과정을 거치고 있습니다.
개인적으로 2025년은 데이콘 대회 10개 이상을 참가하여 모두 상위권에 올라가는 목표를 가지고 있습니다. 랭킹으로서는 챌린저를 넘어서 챔피온까지 갔으면 좋겠습니다. 또한, 다양한 데이터를 접하여 데이터 분석 및 사이언티스트에 대한 역량을 더욱 높여서 성장하는 데이커가 될 수 있도록 하겠습니다.
감사합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved