월간 데이콘 소설 작가 분류 AI 경진대회

알고리즘 | NLP | 분류 | 자연어 | LogLoss

  • moneyIcon 상금 : 100만원+애플워치
  • 1,351명 마감

 

Private 12위, Public 점수 :0.17781, Stacking 모델

2020.12.07 23:31 6,060 조회 language

여러 모델들을 stacking 시켜서 예측을 마지막에 xgboost로 예측하는 모델입니다.

코드
로그인이 필요합니다
0 / 1000
hahaha
2020.12.07 23:35

tfidf fit 하는 과정에 test data가 포함되어 있습니다! 수정하셔야 할 것 같습니다.

lavida
2020.12.07 23:40

삭제된 댓글입니다

lavida
2020.12.07 23:40

삭제된 댓글입니다

lavida
2020.12.07 23:43

확인해보니 테스트 하던 코드로 올렸네요. 알려주셔서 감사합니다 :)

hahaha
2020.12.07 23:45

^^ 노력하신 만큼 좋은 결과 얻어가셨으면 좋겠습니다!

Toona
2020.12.10 11:04

doNN의 코드에 Tokenizer를 fitting하는 과정에 test 데이터가 포함되어 있습니다.
tokenizer = Tokenizer(num_words=nb_words)
tokenizer.fit_on_texts(texts_1 + test_texts_1)