분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
데이터가 극단적으로 치우쳐져있을때 log를 취하자/ XGB 모델
응답시간 데이터에서 극단적으로 큰 값들이 있어, 단순히 이상점으로 없애기는 어렵다고 판단하여 로그를 취하는 방법을 사용함.
수고하셨습니다. 콜랩에서 쉽게 실행 할 수 있었습니다.
마지막에
submission.to_csv('/content/drive/My Drive/dacon_2020_10_심리성향예측/data/sample_submission.csv')
이부분만 넣으면 위코드를 제출 할 수 있습니다.^^
점수는 0.7737047747 이네요
처음 드라이브에 마운트 하시는 분들은 실행하면 링크와 네모칸이 뜹니다.
링크를 누르고 콜랩과 구글드라이브 같은계정에 로그인 하셔야 됩니다.
로그인하면 인증코드가 뜹니다.
from google.colab import drive
drive.mount('/content/drive')
Go to this URL in a browser: https://accounts.google.com/.......
Enter your authorization code: dfjlasdkjflkasd <- 넣어야 합니다.
감사합니다!!
decision tree 계열 모델에 로그를 취하는 것이 성능향상에 도움이 되는건가요?
로그를 취했을 때, valid-auc:0.765949 / 로그를 안 취했을 때, valid-auc:0.764277 이렇게 나옵니다. 유의미한 결과라고 하기는 어려울 수도 있지만, 점수를 조금이라도 올리기위해 로그를 취해서 사용했습니다.
(XGB 모델에서 로그를 취한게 왜 조금이라도(?) 더 좋게나오는지는 저도 잘 모르겠네요..ㅎ) / 혹시나 알게되면 댓글로 달겠습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
감사합니다.