분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
NLP 기초적 접근 1단계 (ngrams, tfidf, DNN, Tensorflow)
Google의 Text Classification Introduction을 기반으로 해당 데이터로 접목시켰습니다.
text로는 "과제명"과 "사업명" 두가지를 사용했습니다.
LB Score는 0.72592로, 굉장히 Simple한 DNN임에도 Baseline보다 높네요 ㅎㅎ
여기서 더 다양하게 Tuning할 수 있는 내용들이 있으니, NLP에 접근하시는 분들에게 추천드립니다.
## 추가 1차
Seed를 random으로 바꾸며 10번 반복 후, Validation Loss를 기준으로 하위 5개 model의 평균 값이 0.73001입니다.
HyperParameterTuning과 모델 재구성 등으로 "Bert를 안써도 성능을 어디까지 높일수 있는가?"에 대해서 짬짬이 테스트 할 예정입니다.
Reference : https://developers.google.cn/machine-learning/guides/text-classification?hl=zh-cn
기세현님 항상 응원 감사합니다! ㅎㅎ
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
자이홍님 항상 감사드립니다!