분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[MIND, Private 3위, 100.3351] 다항회귀를 활용한 주차수요 예측
안녕하세요. 주차수요 예측 AI 경진대회에 참여한 MIND입니다.
전혀 예상치 못했던 private 결과에 한 번 놀라고,
코드를 다시 살펴보면서 군데군데 발견한 초보적 실수들과 논리적 비약에 다시 한 번 놀라게 되는 한 주였습니다.
가령 범주형 피처를 제대로 처리하지 못하고 사용한 점, 그로 인해 다항회귀를 위한 상호작용항 생성시 무의미한 변수가 생성되었을 것이라는 점, 이를 고려하지 않고 PolynomialFeatures로 생성된 모든 항을 모형에 투입한 점 등이 매우 아쉽게 느껴지기만 합니다.
첫 공식 대회 참여인지라 경험이 부족하여 public 스코어 개선 여부에만 집중하기도 했거니와,
대회 도중 데이터 오류 소식에 혼란스러운 와중에 초반 base model로 활용했던 random forest와 lgbm regressor에서 선형회귀로 넘어가며 대혼돈이 있었던 것 같습니다.
이러한 연유로 코드를 공유하기까지 많은 망설임이 있었지만...
최종결과와 무관하게 코드를 공유함으로써 이번 대회에서의 경험을 바탕으로 같은 실수를 반복하지 않도록 깊이 새기고, 더욱 성장할 수 있도록 노력하겠습니다.
새내기의 도전에 흔들리는 인덕원역님, Jay Hong님, 파베르님, 끙정님께서 공유해주신 코드가 정말 큰 도움이 되었습니다.
소중한 코드를 공유해주신 분들께 감사드리며, 마지막까지 지켜봐주신 멘토 gb님께도 몰래 감사를 전해봅니다.
훌륭한 코드를 참고한 것에 비해 부끄러운 결과물이지만,
그저 '이런 생각을 하는 사람도 있었구나...애썼네 녀석...' 정도로 봐주시길 바라봅니다.
모두 고생 많으셨습니다.
감사합니다 :)
2021.10.13 데이터 병합 과정에서 '공급유형'에 대한 오류와 분석과정에 대한 설명에서 수정이 필요한 부분을 발견하여 내용 일부를 수정하였습니다.
우진님, 안녕하세요.
댓글 주신 것을 이제야 확인하는 바람에 늦게나마 답변 드립니다.
출처를 밝히고 기록하시는 것은 무방하나, 기존 코드와 코드에 대한 설명에 수정이 필요한 부분이 있어 내용 일부를 수정하여 재업로드하였으니 참고 부탁드립니다.
아 네 감사합니다 !! ^^
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요!
공유해주신 코드로 열심히 공부했고 정말 많은 도움 받았습니다 ㅠㅠ
개인 블로그에 공부한 내용을 기록 중인데
혹시 괜찮으시다면, 출처를 명확하게 밝히고
공유해주신 코드로 공부한 내용을 기록해도 괜찮을까요..?