뉴스 그룹 분류 AI 해커톤

NLP | Accuracy

  • moneyIcon 상금 : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 432명 마감

 

Keras Baseline 코드(전처리, 토큰화) - 0.59618

2022.04.04 20:20 1,566 조회 language

이전 전복나이예측 대회에서 즈믄님 코드를 가져와서 고쳐서 쓴건데 이번 뉴스예측용으로 바꿔보았습니다.
전처리나 모델을 만들 때 파라미터를 쉽게 변경할 수 있도록 만들었습니다.

전처리로는 stemming 을 해서 vocab을 줄여보거나
학습에는 BERT를 써보거나 Cross Validation, Label Smoothing 등을 추가로 해볼 수 있을 것 같습니다.

코드
로그인이 필요합니다
0 / 1000
동마스
2022.04.09 21:35

코드 잘 봤습니다!! 
keras.callbacks.EarlyStopping에서 monitor를 기본값인 val_loss 보다 val_accuracy로 하는 것이 성능이 더 좋은가요?? 제 코드는 아직 많이 부족하지만 val_loss로 한 것이 더 좋게 나왔어서 질문드립니다!

김희규
2022.04.09 22:34

저도 경험은 많이 부족하지만 val_loss로 하면 validation score보다 test score가 더 좋은 것 같은 느낌이고
val_accuracy로 하면 validation score가 test score와 유사하거나 더 좋을 때가 많은 것 같습니다
요약하면 val_accuracy로 하면 약간 더 오버피팅되는 느낌인데, val score랑 test score가 비교적 유사하게 떠서 val_accuracy를 선호하고 있습니다.
val loss로 하면 예상치 못하게 좋은 결과가 나올 때가 있어서요

동마스
2022.04.09 23:11

답변 감사합니다 ㅎㅎ!