분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
감사합니다!
혹시 생성하신 파생 변수별로 생성 이유를 알 수 있을까요??
횟수 같은 numerical 변수들의 합,차를 파생변수로 만들었을때 성능향상이 있어서 추가했습니다.
기본적으로는 파생변수를 만들고 종속변수와 하나씩 crosstab해가면서 종속변수(0,1)간의 유의미한 비율의 차이를 가지는 경우의 파생변수를 만들려고 노력했습니다
아하 많은 도움 되었습니다. 답변 감사합니다!!
안녕하세요! 정말 고생많으셨습니다.
보다가 궁금증이 생겨 댓글 답니다.
혹시 light-gbm에 대한 가중치가 다른모델에 비해 많이 낮은데 drop하지 않고 가져가신 이유에 대해 여쭤봐도 될까요 ?
좋은하루 보내시길 바랍니다 :)
모델 속도 때문에 feature engineering 할 때에는 lgbm의 cv 증감을 확인하면서 했습니다. 그래서 파생변수의 기준이 되는lgbm을 drop하지는 않았습니다!
실제로 lgbm의 가중치를 0으로 놨을때 보다는 최소한의 가중치로 두는게 public에서 성능향상이 있기도 했구용.
예선,본선 둘 다 고생 많으셨습니다:)
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
수고하셨습니다.