Credit Card Customer Segmentation AI Competition

Algorithm | Monthly Dacon | Structured | Finance | Classification | F1 Score

  • moneyIcon Prize : DASCHOOL Pro Subscription
  • 2025.03.10 ~ 2025.04.30 09:59 + Google Calendar
  • 1,508 Users Completed

 

[Private 23th] LightGBM + class weight (CPU friendly)

2025.05.03 15:29 335 Views language

나름 이런저런 시도를 하였으나... 기대했던 것만큼 좋은 퍼포먼스를 보여주지는 못한 코드입니다. 다른 분들이 올린 코드를 보면 실패 이유도 명확했구요.
그럼에도 cpu에서도 약하지 않게 돌아가는 코드라는 데에 의의를 두고 공유해봅니다.

(코드 속 'train_df.parquet', 'test_df.parquet'은 모두 베이스라인 코드의 전처리를 따라간 결과입니다. 물론 train dataset의 정보가 validation dataset으로 일부 들어가버린다는 사실은 알고 있었다만... 이상하게도 이렇게 하는 방식이 제일 높은 점수를 가져왔네요.)


결국은 'imbalanced dataset을 어떻게 처리할지'를 고민해야했던 대회입니다. F1 Score를 극대화하기 위해서 소수의 클래스인 A와 (특히) B를 예측하는 게 마냥 쉽지는 않았네요.
다들 수고하셨습니다.

Code
Login Required
0 / 1000
과적합방지위원회
2025.05.03 15:54

저도 class imbalance 가 심해서 고생을 많이했네요 .. 수고 많으셨습니다!

rootenter
2025.05.03 15:58

A, B 클래스만 따로 빼서 분류시키는 것만으로도 데이터 불균형을 어느정도 극복할 수 있다는 데에 놀랐어요. 좋은 코드 공유해주셔서 감사하고, 또 Private 1위 축하드립니다.