분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Private 2위, MissForest, Oversampling, KNN
안녕하세요. datu입니다. 다들 대회 진행하시느라 고생 많으셨습니다.
코드 잘 봤습니다. 혹시 feature 선택 기준에 대해서 공유해주실 수 있으실까요??
feature 선택은 validation dataset과 class의 상관관계를 확인하여 선정하였습니다.
감사합니다
df_imputed = imputer.fit_transform(df, cat_vars=cat_cols) 부분에서 계속 오류가 뜨는데
앞에 cat_cols 정의하는 코드가 잘못된건가요?
저는 문제없이 작동하는 거 같은데 cat_col에 들어가있는 변수 확인 해보시는게 좋을 거 같아요!
삭제된 댓글입니다
valid2의 변수가 어떤 설정인지 궁금합니다.
시간이 조금 지나 완벽히 기억이 나진 않지만 상관관계를 확인하고 다른 변수를 추가했던 것을 valid2라고 설정했던 거 같습니다! 정확한 답변을 드리지 못해 너무 죄송해요...
아하 그렇군요!! 감사합니다~~!! ^^
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Miss forest도 있었군요..코드 공유 감사합니다.