월간 데이콘 소설 작가 분류 AI 경진대회

알고리즘 | NLP | 분류 | 자연어 | LogLoss

  • moneyIcon 상금 : 100만원+애플워치
  • 1,418명 마감

 

Private : 2위, Public Score : 0.14422, XGB

2020.12.06 22:00 6,375 조회 language

kaggle에 비슷한 대회가 있었기에 참고하였습니다.
https://www.kaggle.com/marcospinaci/0-335-log-loss-in-a-dozen-lines
https://www.kaggle.com/sudalairajkumar/simple-feature-engg-notebook-spooky-author

아직 초보라 코드가 깔끔하지 않습니다 ㅠㅠ
고수님들을 보고 많이 배우겠습니다! 감사합니다~

코드
로그인이 필요합니다
0 / 1000
당쇠
2020.12.06 22:23

수고하셨습니다.  고마워 감사해 님

감사합니다.

고마워 감사해
2020.12.07 15:44

감사합니다~ 좋은 경험이었습니다!!

yulia
2020.12.07 15:59

고생 많으셨네요 ^_^ 코드 잘 봤습니다 ~

고마워 감사해
2020.12.07 19:07

네~ 감사합니다 ^^

Jay 윤
2020.12.07 17:43

트리모델 이외에 Fasttext에 cnn까지 섞으니 확실히 성능이 좋네요 

수고하셨습니다!

고마워 감사해
2020.12.07 19:08

Jay 윤님 코드도 잘 봤습니다~
수고하셨습니다!

파이썬초보만
2020.12.08 12:17

코드 잘봤습니다 수고하셨습니다~

고마워 감사해
2020.12.09 18:42

감사합니다!! StarWaz88님도 수고하셨습니다~

하비두비
2020.12.08 17:21

수고하셨어요 코드 잘 봤습니다~!! 이정도면 1등감인데요??!!

고마워 감사해
2020.12.09 18:42

좋은 말씀 감사합니다!!ㅠㅠ 덕분에 공부할 맛이 나는 것 같아요 ㅎㅎ

Toona
2020.12.10 12:09

신경망 피쳐를 만들기 위한 토크나이저 생성 시 data leackage가 발생하는 것 같습니다.

tokenizer = Tokenizer(num_words=nb_words)
tokenizer.fit_on_texts(texts_1 + test_texts_1)

해당 부분에서 test 데이터셋이 토크나이저 훈련에 사용되었습니다.

고마워 감사해
2020.12.11 16:19

넵넵 감사합니다~ 코드 수정했어용 아이러니하게 최종 스코어는 더 좋아졌습니다 감사합니다~!!