분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
XGBRegressor (EDA to Prediction) (public: 3.11771)
데이터에 대한 EDA, Feature Engineering, Modeling까지 진행한 코드입니다.
나름대로 EDA를 한 결과를 토대로 Feature Engineering을 진행하였고,
그 feature를 이용하여 XGBRegressor를 이용하여 최종 예측을 진행하였습니다.
부족한 코드와 실력이지만, 여러 실력자 분들의 코멘트를 받고 공부하고자 코드 업로드 합니다.
많은 조언 부탁드립니다!!
저도 초보자라 많이 부족한데 좋게 봐주셔서 감사합니다 :) 같이 화이팅하시죠!! ㅎ
그래서 결국 결측치는 어떻게 처리하신 건가요? 베이스라인 해설대로 최빈값으로 대체했나요 아니면 결측값 자체를 하나의 범주로 생각하고 0이나 다른 이름으로 채우셨나요?
결측치가 있는 feature가 keyword , referral_path인데, 각각이 특정 경우에 (일반적으로) 설정된다는 설명을 기반으로 결측치를 하나의 범주로 생각하고 처리했습니다. 혹시 더 좋은 방법이 있으시면 소개 부탁드리겠습니다!! 감사합니다
- keyword 트래픽 소스의 키워드, 일반적으로 traffic_medium이 organic, cpc인 경우에 설정
: traffic_medium이 organic, cpc인 경우를 1, 결측치를 0으로 처리
- referral_path traffic_medium이 referral인 경우 설정되는 경로
: traffic_medium이 referral인 경우를 1, 결측치를 0으로 처리
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
감사합니다 !! 꼼곰하게 설명해주셔서 입문자인데 덕분에 많이 배우고 갑니다 ㅜㅜ