자연어 기반 기후기술분류 AI 경진대회

알고리즘 | NLP | 분류 | 환경 | Macro f1 score

  • moneyIcon Prize : 총 600만원
  • 1,035명 마감

 

NLP 기초적 접근 2단계 (전처리, DNN 개선, Tensorflow)

2021.08.04 15:19 3,980 Views language

안녕하세요

어제 게시했던 "NLP 기초적인 접근 (ngrams, tfidf, DNN)"을 조금 더 업그레이드 했습니다.
자세한 내용은 코드블록에서 다루었으니, 참고해 주세요!

어디까지나 "Pretrained Model"없이 어디까지 성능을 높일 수 있는가에 대해서 테스트를 하는 중입니다.
아직 개선할 지점들이 더러 보이니 개선해보겠습니다.

즐코되세요~

+ 단순 제출 점수 0.74496입니다.
++ 의문점 : 데이터가 심각한 Imbalance이기 때문에, 모두 다 0으로 찍어버리는 것은 아닌지 고민이 됨. Treshold 기준을 완화하거나, SMOTE등 Imbalance를 해결할 방법을 모색하는 것도 좋을 것으로 보입니다.

## 1차 수정 ##
Top_k 8만이네요;; 
업로드하자마자 오타가 보이는군요

## 2차 수정 ##
코드 정리하고, Seed 변동으로 10번 하는 코드입니다.
메모리 문제로 1회씩 5회 반복해서 5가지의 Submisison을 만들고,
마지막에 모두 불러와 최빈값을 기준으로 뽑아오게 했습니다.

+ 해당 코드의 성능은 LB 0.75016입니다.

Code
로그인이 필요합니다
0 / 1000
당쇠
2021.08.04 21:04

📚감사합니다~ 

Jay Hong
2021.08.05 15:04

감사합니다 😀

insub
2021.08.05 09:42

도움이 많이 되었습니다. 정말 감사합니다.

Jay Hong
2021.08.05 15:04

도움이 되었다니, 기분이 좋네요 ㅎㅎ 감사합니다 😀

DimensionSTP
2021.08.05 09:46

감사합니다.

Jay Hong
2021.08.05 15:04

저도 감사합니다 😀

uncle7
2021.08.08 19:19

자료 감사합니다. 도움이 많이 되었습니다. 

Jay Hong
2021.08.10 14:00

감사합니다 😀