분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
쇼핑몰 지점별 매출액 예측 AI 해커톤
Store / IsHoliday 변수의 원핫인코딩에 대해 궁금한게 있습니다.
다른 분들의 코드를 참고하니 Store와 IsHoliday에 원핫 인코딩을해서 학습을 하신 분들이 많더라고요
근데 저도 해보니 하지 않았을 때가 했을 때보다 submission기준으로 좋았습니다.
원핫인코딩을 해야하는 이유와 혹시 했을때 점수가 낮게 나온 이유에 대해서 아시는 분 계실까요?
제 기준으로는 했을 때가 더 좋았습니다. (Store만 했어요)
트리기반 모델에서는 원핫인코딩을 할 필요가 없다고 이론 공부 중에 봤었으나, 실제로 해보니 크게 증가했습니다.
제 경우, 성능 증가한 이유는 원핫인코딩 하지않을 경우에 Store의 값 1~45가 수치형(순서형)으로 인식되어 모델에 잘못된 정보가 학습될 수 있어서 그런 것 같습니다.
글쓴이님 경우에 성능이 오히려 감소한 건 직접 말하신 대로 차원 증가 때문이거나 늘어난 차원에 따라서 모델의 크기가 커져야하는데 그러지 않아서ㅡ 이지 않을까 생각합니다. (부족한 실력이라 제가 한 말이 틀릴 수도 있습니다.)
아 depth를 제가 튜닝하지 않아서 개선되지 않았을 수도 있겠네요...! 한 번 이거 다시 해보도록 하겠습니다!!
좋은 조언 정말 감사합니다 ㅎㅎㅎㅎ
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
개인적인 생각으로는 Store와 IsHoliday만 해도 차원이 47개가 증가하니 그런 것 같네요