난임 환자 대상 임신 성공 여부 예측 AI 온라인 해커톤

LG Aimers | 채용 | 알고리즘 | 의료 | 바이오 | 정형 | 분류 | ROC-AUC

  • moneyIcon 상금 : 본선 진출
  • 1,568명 마감
마감

 

예선 코드 공유 (private 13위)

2025.04.07 12:48 1,213 조회 language

본선이 끝나서 뒤늦게 올려봅니다 
모두 수고하셨습니다~

PDF
코드
로그인이 필요합니다
0 / 1000
도비콘
2025.04.07 15:56

수고하셨습니다.

code7monkey
2025.04.08 10:49

감사합니다!

국어선생님
2025.04.08 11:15

혹시 생성하신 파생 변수별로 생성 이유를 알 수 있을까요??

code7monkey
2025.04.08 11:22

횟수 같은 numerical 변수들의 합,차를 파생변수로 만들었을때 성능향상이 있어서 추가했습니다.
기본적으로는 파생변수를 만들고 종속변수와 하나씩 crosstab해가면서 종속변수(0,1)간의 유의미한 비율의 차이를 가지는 경우의 파생변수를 만들려고 노력했습니다

국어선생님
2025.04.08 11:30

아하 많은 도움 되었습니다. 답변 감사합니다!!

송하영
2025.04.28 01:17

안녕하세요! 정말 고생많으셨습니다.

보다가 궁금증이 생겨 댓글 답니다.
혹시 light-gbm에 대한 가중치가 다른모델에 비해 많이 낮은데 drop하지 않고 가져가신 이유에 대해 여쭤봐도 될까요 ?

좋은하루 보내시길 바랍니다 :)

code7monkey
2025.04.28 08:17

모델 속도 때문에 feature engineering 할 때에는 lgbm의 cv 증감을 확인하면서 했습니다. 그래서 파생변수의 기준이 되는lgbm을 drop하지는 않았습니다! 
실제로 lgbm의 가중치를 0으로 놨을때 보다는 최소한의 가중치로 두는게 public에서 성능향상이 있기도 했구용.
예선,본선 둘 다 고생 많으셨습니다:)