건설기계 오일 상태 분류 AI 경진대회

알고리즘 | 정형 | 건설기계 | 분류 | Macro f1 score

  • moneyIcon 상금 : 1,000 만원
  • 1,331명 마감

 

[Private 7위] 불균형 데이터 샘플링 기법 적용

2022.12.19 22:29 2,679 조회 language

안녕하세요 Public 27등, Private 7등 기록한 고래관광선_H팀의 고래관광선무임승차우영우입니다.

시계열 데이터만 다루다 분류 문제를 처음 진행하며 새로운 정보를 많이 얻어 갑니다.

대회에서 제공받은 데이터의 Y_LABEL 값의 불균형으로 인해 예측 모델 성능이 원하는 만큼 나오지 않는것 같아 불균형 데이터에 적용가능한 샘플링 기법을 찾아, 적용 해보았습니다.

물론 해당 데이터에서는 그런한 문제를 해결하는데 큰 도움이 된거 같진 않지만 그래도 다른 불균형 데이터를 다루는 분들에게 도움이 될까해서 코드 공유합니다.  

코드
로그인이 필요합니다
0 / 1000
WOONGSONVI
2022.12.20 08:05

저도 처음에 불균형 데이터여서 SMOTE, ADASYN을 사용했었는데 성능이 좋지 않더라구요
좋은 글 감사합니다!