분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
양방향 LSTM
소설 작가 분류 대회에 코드 공유되어 있는 hyukstory님의 코드 공유를 따라해보았습니다.
좋은 코드를 공유해주신 hyukstory님에게 감사의 인사를 표합니다.
https://dacon.io/codeshare/2357?page=1&dtype=recent
for i, (i_trn, i_val) in enumerate(cv.split(train_x, Y_train), 1):
print(f'training model for CV #{i}')
model3.fit(train_x[i_trn],
to_categorical(Y_train[i_trn]),
validation_data=(train_x[i_val], to_categorical(Y_train[i_val])),
epochs=10,
batch_size=512)
fold 마다 모델을 초기화하셔야 할 듯 합니다.
이미 model3이 valid 데이터 셋을 외우게 되어서 data-leak이 생길 듯 합니다.
다음 fold로 갈수록 epoch이 낮을 때 accuracy가 높아지네요.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
교차검증을 자연어 처리 많이 배우고 갑니다.