분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
NLP 기초적 접근 2단계 (전처리, DNN 개선, Tensorflow)
안녕하세요
어제 게시했던 "NLP 기초적인 접근 (ngrams, tfidf, DNN)"을 조금 더 업그레이드 했습니다.
자세한 내용은 코드블록에서 다루었으니, 참고해 주세요!
어디까지나 "Pretrained Model"없이 어디까지 성능을 높일 수 있는가에 대해서 테스트를 하는 중입니다.
아직 개선할 지점들이 더러 보이니 개선해보겠습니다.
즐코되세요~
+ 단순 제출 점수 0.74496입니다.
++ 의문점 : 데이터가 심각한 Imbalance이기 때문에, 모두 다 0으로 찍어버리는 것은 아닌지 고민이 됨. Treshold 기준을 완화하거나, SMOTE등 Imbalance를 해결할 방법을 모색하는 것도 좋을 것으로 보입니다.
## 1차 수정 ##
Top_k 8만이네요;;
업로드하자마자 오타가 보이는군요
## 2차 수정 ##
코드 정리하고, Seed 변동으로 10번 하는 코드입니다.
메모리 문제로 1회씩 5회 반복해서 5가지의 Submisison을 만들고,
마지막에 모두 불러와 최빈값을 기준으로 뽑아오게 했습니다.
+ 해당 코드의 성능은 LB 0.75016입니다.
감사합니다 😀
도움이 많이 되었습니다. 정말 감사합니다.
도움이 되었다니, 기분이 좋네요 ㅎㅎ 감사합니다 😀
감사합니다.
저도 감사합니다 😀
자료 감사합니다. 도움이 많이 되었습니다.
감사합니다 😀
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
📚감사합니다~