SW중심대학 공동 AI 경진대회 ❮예선❯

SW중심대학 | 예선 | 심리성향 | AUC

Prize : Total 0만원
2022.08.01 ~ 2022.08.26 17:59 + Google Calendar
770 Users Completed

Practice

Overview Data Code (share) Talk Leaderboard

Submission

[쿠민의힘] Private 7위, 점수 : 0.90276, ExtraTrees + LGBM

Rahites

공동작성자

2022.08.29 14:48 3,795 Views language

[쿠민의힘] ( ExtraTrees + LGBM, 3가지 submission 앙상블 )
Public 5위, 점수 : 0.90684
Private 7위, 점수 : 0.90276
저희는 3가지 버전으로 각기 다른 피처를 생성하고 각 피처에 맞는 튜닝을 진행한 후 3가지 결과물을 최종적으로 앙상블 하였습니다.

Code

2 Comments

comment

0 / 1000

john428

2022.09.04 11:55

for i in test.columns:
test.loc[test[i].isna(), i] = test[i].mode()[0]

해당 부분에서 훈련 세트의 최빈값이 아닌 테스트 데이터의 최빈값을 이용하는 것은 dataleakage에 해당 되는 것 같습니다

Rahites

2022.09.17 18:49

그렇네요... 확인해본 결과 train data의 mode값과 test data의 mode값은 testelapse과 surveyelapse column에서의 값이 82, 161 -> 94, 145로 차이가 있는 것을 확인했습니다. 모델의 성능 자체는 결측치를 채우는 데 있어 두 feature에 대한 차이만 존재하기 때문에 기존 성능과 큰 차이는 없을 것 같습니다. 이번에 Data Leakage 규정을 제대로 숙지하지 못하였는데 다음에는 더 자세히 검토해보도록 하겠습니다. 좋은 지적 감사합니다!!

📣 The comment input field has been moved to the top of the comment list!

List

[아디띠&은영서]Private 145위, Public 점수 : 0.80588, RandomForest 모델

Competition - SW중심대학 공동 AI 경진대회 ❮예선❯

Current

[쿠민의힘] Private 7위, 점수 : 0.90276, ExtraTrees + LGBM

Competition - SW중심대학 공동 AI 경진대회 ❮예선❯

Likes 6