분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Keras Baseline 코드(전처리, 토큰화) - 0.59618
이전 전복나이예측 대회에서 즈믄님 코드를 가져와서 고쳐서 쓴건데 이번 뉴스예측용으로 바꿔보았습니다.
전처리나 모델을 만들 때 파라미터를 쉽게 변경할 수 있도록 만들었습니다.
전처리로는 stemming 을 해서 vocab을 줄여보거나
학습에는 BERT를 써보거나 Cross Validation, Label Smoothing 등을 추가로 해볼 수 있을 것 같습니다.
저도 경험은 많이 부족하지만 val_loss로 하면 validation score보다 test score가 더 좋은 것 같은 느낌이고
val_accuracy로 하면 validation score가 test score와 유사하거나 더 좋을 때가 많은 것 같습니다
요약하면 val_accuracy로 하면 약간 더 오버피팅되는 느낌인데, val score랑 test score가 비교적 유사하게 떠서 val_accuracy를 선호하고 있습니다.
val loss로 하면 예상치 못하게 좋은 결과가 나올 때가 있어서요
답변 감사합니다 ㅎㅎ!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드 잘 봤습니다!!
keras.callbacks.EarlyStopping에서 monitor를 기본값인 val_loss 보다 val_accuracy로 하는 것이 성능이 더 좋은가요?? 제 코드는 아직 많이 부족하지만 val_loss로 한 것이 더 좋게 나왔어서 질문드립니다!