분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
NLP 기초적 접근 1단계 (ngrams, tfidf, DNN, Tensorflow)
Google의 Text Classification Introduction을 기반으로 해당 데이터로 접목시켰습니다.
text로는 "과제명"과 "사업명" 두가지를 사용했습니다.
LB Score는 0.72592로, 굉장히 Simple한 DNN임에도 Baseline보다 높네요 ㅎㅎ
여기서 더 다양하게 Tuning할 수 있는 내용들이 있으니, NLP에 접근하시는 분들에게 추천드립니다.
## 추가 1차
Seed를 random으로 바꾸며 10번 반복 후, Validation Loss를 기준으로 하위 5개 model의 평균 값이 0.73001입니다.
HyperParameterTuning과 모델 재구성 등으로 "Bert를 안써도 성능을 어디까지 높일수 있는가?"에 대해서 짬짬이 테스트 할 예정입니다.
Reference : https://developers.google.cn/machine-learning/guides/text-classification?hl=zh-cn
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
자이홍님 항상 감사드립니다!