분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 1위] CatboostRegressor
공동작성자
저희는 LINE 변수로 grouping 하여 데이터를 분석했습니다.
특히 T050304과 T050307에 집중하여 해당 두 라인을 합친 후 feature selection을 진행하고 모델을 따로 학습시키는 방법으로 좋은 성능을 낼 수 있었습니다.
시간이 부족하여 다른 라인에 대해서는 더 하진 못했으나 의미있는 접근 방식이었다고 생각합니다!
늦게 확인해서 이제야 답변드립니다..
기억을 더듬어 보자면,
결측 feature 발생 양상이 비슷하게 나타나는 것을 관측했습니다.(1-2번, 3-4번,5-6번)
따로도 학습을 진행을 시켜보았으나 합친것보다는 성능이 안 좋은 경우가 대부분이었으며 묶이는 라인별로 결측열이 거의 비슷하게 관측이 되어(그렇게 차이가 없었습니다) 그렇게 진행하였습니다.
답변 감사합니다. 그리고 수상 축하합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
수고하셨습니다. 👍
혹시 라인을 합치신 이유가 따로 있으신가요?