월간 데이콘 심리 성향 예측 AI 경진대회

알고리즘 | 정형 | 분류 | 심리 | AUC

  • moneyIcon 상금 : 100만원+애플워치
  • 2,087명 마감

 

데이터가 극단적으로 치우쳐져있을때 log를 취하자/ XGB 모델

2020.11.15 04:47 6,484 조회 language

응답시간 데이터에서 극단적으로 큰 값들이 있어, 단순히 이상점으로 없애기는 어렵다고 판단하여 로그를 취하는 방법을 사용함.

코드
로그인이 필요합니다
0 / 1000
도비콘
2020.11.15 10:21

감사합니다.

당쇠
2020.11.15 13:53

수고하셨습니다. 콜랩에서 쉽게  실행 할 수 있었습니다.

당쇠
2020.11.15 14:03

마지막에 

submission.to_csv('/content/drive/My Drive/dacon_2020_10_심리성향예측/data/sample_submission.csv') 

이부분만 넣으면 위코드를 제출 할 수 있습니다.^^

점수는 0.7737047747 이네요

당쇠
2020.11.16 11:57

처음 드라이브에 마운트 하시는 분들은 실행하면 링크와 네모칸이 뜹니다. 
링크를 누르고 콜랩과 구글드라이브 같은계정에 로그인 하셔야 됩니다.
로그인하면 인증코드가 뜹니다.

from google.colab import drive
drive.mount('/content/drive')

Go to this URL in a browser: https://accounts.google.com/.......
Enter your authorization code: dfjlasdkjflkasd <- 넣어야 합니다.

DACON.ZERO
2020.11.16 09:56

감사합니다!!

뚱냥이
2020.11.16 19:51

decision tree 계열 모델에 로그를 취하는 것이 성능향상에 도움이 되는건가요? 

연성이
2020.11.17 03:20

로그를 취했을 때, valid-auc:0.765949 / 로그를 안 취했을 때, valid-auc:0.764277 이렇게 나옵니다. 유의미한 결과라고 하기는 어려울 수도 있지만, 점수를 조금이라도 올리기위해 로그를 취해서 사용했습니다.

(XGB 모델에서 로그를 취한게  왜 조금이라도(?) 더 좋게나오는지는 저도 잘 모르겠네요..ㅎ) / 혹시나 알게되면 댓글로 달겠습니다.