칼로리 소모량 예측 AI 해커톤

알고리즘 | 정형 | 회귀 | 헬스 | RMSE

  • moneyIcon 상금 : 인증서
  • 670명 마감

 

[Private 1st - 0.10554] PolynomialFeatures, Round+Ensembles

2023.04.25 04:34 1,575 조회 language

Round + Voting과 Round + Stacking 중 어떤 파일이 더 낮은지 확인이 안 되어 둘 다 포함해서 코드 공유합니다!

코드
로그인이 필요합니다
0 / 1000
정새
2023.04.25 09:14

PolynomialFeatures를 2에서 높여 사용할 때, 오히려 성능이 하락했었는데 특성 공학이 지나쳤나보네요.

많은 공부가 됐습니다. 코드 공유 감사합니다.

설빙더아이스
2023.04.25 10:27

생각보다 feature engineering을 해서 얻는 성능 향상보다 feature를 drop해서 얻는 성능 향상이 많은 것 같습니다.. 
알면 알수록 신기한 정형 데이터의 세계이네요.😅

설빙더아이스
2023.04.25 10:25

제일 위 코드에 pip install pyautogluon 이라고 적혀있는데   pip install autogluon  이 맞습니다!
오타입니다 ㅜㅜ

캣_지피티
2023.04.25 11:59

설빙 더 아이스님 수고 많으셨습니다!! 1등 축하드립니다 ㅎㅎ 대회 도중 좋은 피쳐 처리 방법도 공유해주시고 정말 멋있습니다.

통닭먹으러
2023.04.25 16:03

코드 공유 감사합니다. 많은 공부하고 갑니다.

스태킹 진행이 모델 두 개를 train, val 데이터를 통해서 학습하여 나온 예측 값 두 개를 다시 인풋으로 넣어서 val 데이터를 통해 학습하고, 이후 테스트 셋에 적용 시에는 기존에 학습 된 모델 두 개를 통해 나온 예측 값을 다시 스태킹 모델에 넣는 절차가 맞을까요?

Idea경진대회
2023.05.30 21:45

안녕하세요. 글 잘 읽었습니다.
궁금한 것이 있어서 여쭤봅니다.
선생님께서 하신 polymonial이후에 sm.ols를 확인해보았습니다.
변수 중에서 p|t|값이 유의하지 않은 값도 있었고, 다중공선성의 문제도 있었습니다.

혹시 이런 대회를 하실 때에 다중공선성이나 유의성을 따지지 않아도 되는건가요??
않아도 된다면 이유가 궁금합니다!!