[신규 오픈 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Dacon 답변요청]단어 임베딩 시 미리 임베딩된 값을 불러와도 되나요 ?
단어 임베딩 시 미리 임베딩된 데이터를 불러와도 되나요 ?
다른 NLP 대회에서는 임베딩 값을 처리하는 부분이 전처리 단계에서는 사용가능하다고 하였는데 이 대회에서는 어떻게 적용되는지 나와있지 않네요.
끝나는 시점에 급하게 물어보게 됐네요 ㅠㅠ
안녕하세요. 원하는 답변을 받지 못한 것 같아 재질문 합니다.
최근에 끝난 대회를 보면 fasttext, glove, word2vec 처럼 미리 학습되어 공개되어 있는 임베딩 모델을 전처리 과정에서 사용 가능하다 되어 있는데 이 대회는 어떤지 궁금합니다.
규칙에 허용된 모델(ETRI-BERT, SKT-BERT, SKT-GPT)의 임베딩된 정보는 활용이 가능하나 테스트 데이터를 이용한 임베딩은 Data Leakage에 해당되어 불가능합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요 작성자님.
테스트 데이터는 학습과정에서 사용되서는 안됩니다.
감사합니다.
데이콘 드림.