분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[DACON 답변 요청] 수정된 규칙(사전학습모델)에 관해 질문합니다.
한국어 문서 대회 규칙에 관해 질문합니다.
어제 11/13 생성 대회의 토론 항목에서 "pre-trained 모델 사용 관련 문의 드립니다' 글이 올라오고 사용가능한 pre-trained model을
규칙에 추가하셨습니다. (https://dacon.io/competitions/official/235673/talkboard/401776?page=1&dtype=recent&ptype=pub)
규칙에는 '공개된 Pre-trained 모델을 사용가능하나, ETRI-BERT, SKT-BERT, SKT-GPT로 한정합니다.' 로 되어 있습니다.
저는 공개된 pretrained-models 중 HanBerT(https://github.com/monologg/HanBert-Transformers)를 사용했습니다.
그래서 규칙이 수정되기 전 HanBert를 이용한 결과물을 제출하였습니다.
저와 같이 규칙 변경 이전에 수정된 규칙에 속한 pretrained 모델을 사용하지 않고 제출하신 분들이 계실 텐데 이러한 상황에 대해 어떻게 하실지 궁금합니다.
삭제된 댓글입니다
현재 HanBert 관련 github은 두 가지가 있습니다.
https://github.com/monologg/HanBert-Transformers
https://github.com/tbai2019/HanBert-54k-N
운영자님이 말씀하시는 HanBert(https://github.com/tbai2019/HanBert-54k-N)로
해당 페이지에서 "HanBERT 54kN 300만 Steps 모델의 공개를 중단합니다. (2020년 10월 25일)"라고 되어 있고
https://github.com/monologg/HanBert-Transformers 에서는 Pretrained 모델을 지금도 받을 수 있습니다.
그래서 저는 300만 steps이 아닌 pretrained 모델은 공개했다고 보고 사용한 것인데요.
이 부분에 대한 답변 부탁드립니다.
그리고 공개된 pretrained 모델로 KoELECTRA가 있습니다.
이 모델은 사용이 불가능한가요?
https://github.com/monologg/HanBert-Transformers에서 배포하는 모델은 https://github.com/tbai2019/HanBert-54k-N에서 배포된 모델을 pytorch로 변환한 것으로 원 저작자가 상업적 이용을 금지하였기에 상금이 걸린 경진대회에서는 사용이 불가합니다.
KoELECTRA의 경우 학습 데이터에 나무위키 데이터가 포함 되어있는데 나무위키의 저작권은 영리 목적의 이용이 금지되어 있어 저작권 이슈가 있는지 검토 후 답변드리겠습니다.
KoELECTRA 학습에 사용된 데이터 저작권 이슈가 있어 사용이 불가합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요 때를기다리는자님.
HanBert의 경우 2020년 10월 25일부로 모델의 공개가 중단된 상태로 본 대회에서 사용이 불가능합니다.
감사합니다.
데이콘 드림.