분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 1st - 0.10554] PolynomialFeatures, Round+Ensembles
Round + Voting과 Round + Stacking 중 어떤 파일이 더 낮은지 확인이 안 되어 둘 다 포함해서 코드 공유합니다!
생각보다 feature engineering을 해서 얻는 성능 향상보다 feature를 drop해서 얻는 성능 향상이 많은 것 같습니다..
알면 알수록 신기한 정형 데이터의 세계이네요.😅
제일 위 코드에 pip install pyautogluon 이라고 적혀있는데 pip install autogluon 이 맞습니다!
오타입니다 ㅜㅜ
설빙 더 아이스님 수고 많으셨습니다!! 1등 축하드립니다 ㅎㅎ 대회 도중 좋은 피쳐 처리 방법도 공유해주시고 정말 멋있습니다.
코드 공유 감사합니다. 많은 공부하고 갑니다.
스태킹 진행이 모델 두 개를 train, val 데이터를 통해서 학습하여 나온 예측 값 두 개를 다시 인풋으로 넣어서 val 데이터를 통해 학습하고, 이후 테스트 셋에 적용 시에는 기존에 학습 된 모델 두 개를 통해 나온 예측 값을 다시 스태킹 모델에 넣는 절차가 맞을까요?
안녕하세요. 글 잘 읽었습니다.
궁금한 것이 있어서 여쭤봅니다.
선생님께서 하신 polymonial이후에 sm.ols를 확인해보았습니다.
변수 중에서 p|t|값이 유의하지 않은 값도 있었고, 다중공선성의 문제도 있었습니다.
혹시 이런 대회를 하실 때에 다중공선성이나 유의성을 따지지 않아도 되는건가요??
않아도 된다면 이유가 궁금합니다!!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
PolynomialFeatures를 2에서 높여 사용할 때, 오히려 성능이 하락했었는데 특성 공학이 지나쳤나보네요.
많은 공부가 됐습니다. 코드 공유 감사합니다.