분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
NLP 기초적 접근 2단계 (전처리, DNN 개선, Tensorflow)
안녕하세요
어제 게시했던 "NLP 기초적인 접근 (ngrams, tfidf, DNN)"을 조금 더 업그레이드 했습니다.
자세한 내용은 코드블록에서 다루었으니, 참고해 주세요!
어디까지나 "Pretrained Model"없이 어디까지 성능을 높일 수 있는가에 대해서 테스트를 하는 중입니다.
아직 개선할 지점들이 더러 보이니 개선해보겠습니다.
즐코되세요~
+ 단순 제출 점수 0.74496입니다.
++ 의문점 : 데이터가 심각한 Imbalance이기 때문에, 모두 다 0으로 찍어버리는 것은 아닌지 고민이 됨. Treshold 기준을 완화하거나, SMOTE등 Imbalance를 해결할 방법을 모색하는 것도 좋을 것으로 보입니다.
## 1차 수정 ##
Top_k 8만이네요;;
업로드하자마자 오타가 보이는군요
## 2차 수정 ##
코드 정리하고, Seed 변동으로 10번 하는 코드입니다.
메모리 문제로 1회씩 5회 반복해서 5가지의 Submisison을 만들고,
마지막에 모두 불러와 최빈값을 기준으로 뽑아오게 했습니다.
+ 해당 코드의 성능은 LB 0.75016입니다.
감사합니다 😀
도움이 많이 되었습니다. 정말 감사합니다.
도움이 되었다니, 기분이 좋네요 ㅎㅎ 감사합니다 😀
감사합니다.
저도 감사합니다 😀
자료 감사합니다. 도움이 많이 되었습니다.
감사합니다 😀
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
📚감사합니다~