자연어 기반 기후기술분류 AI 경진대회

알고리즘 | NLP | 분류 | 환경 | Macro f1 score

  • moneyIcon Prize : 총 600만원
  • 1,035명 마감

 

NLP 기초적 접근 1단계 (ngrams, tfidf, DNN, Tensorflow)

2021.08.03 16:06 4,946 Views language

Google의 Text Classification Introduction을 기반으로 해당 데이터로 접목시켰습니다.

text로는 "과제명"과 "사업명" 두가지를 사용했습니다.

LB Score는 0.72592로, 굉장히 Simple한 DNN임에도 Baseline보다 높네요 ㅎㅎ
여기서 더 다양하게 Tuning할 수 있는 내용들이 있으니, NLP에 접근하시는 분들에게 추천드립니다.

## 추가 1차
Seed를 random으로 바꾸며 10번 반복 후, Validation Loss를 기준으로 하위 5개 model의 평균 값이 0.73001입니다.
HyperParameterTuning과 모델 재구성 등으로 "Bert를 안써도 성능을 어디까지 높일수 있는가?"에 대해서 짬짬이 테스트 할 예정입니다.

Reference : https://developers.google.cn/machine-learning/guides/text-classification?hl=zh-cn

Code
로그인이 필요합니다
0 / 1000
shki
2021.08.04 08:56

자이홍님 항상 감사드립니다!

Jay Hong
2021.08.04 17:13

기세현님 항상 응원 감사합니다! ㅎㅎ