한국어 문서 추출요약 AI 경진대회

알고리즘 | 텍스트 | 생성요약 | 언어 | ROUGE-N

  • moneyIcon 상금 : 총 1,000만원
  • 1,169명 마감

 

[DACON 답변 요청] 수정된 규칙(사전학습모델)에 관해 질문합니다.

2020.11.14 01:07 3,501 조회

한국어 문서 대회 규칙에 관해 질문합니다.


어제 11/13 생성 대회의 토론 항목에서 "pre-trained 모델 사용 관련 문의 드립니다' 글이 올라오고 사용가능한 pre-trained model을

규칙에 추가하셨습니다. (https://dacon.io/competitions/official/235673/talkboard/401776?page=1&dtype=recent&ptype=pub)


규칙에는 '공개된 Pre-trained 모델을 사용가능하나, ETRI-BERT, SKT-BERT, SKT-GPT로 한정합니다.' 로 되어 있습니다.


저는 공개된 pretrained-models 중 HanBerT(https://github.com/monologg/HanBert-Transformers)를 사용했습니다.


그래서 규칙이 수정되기 전 HanBert를 이용한 결과물을 제출하였습니다.


저와 같이 규칙 변경 이전에 수정된 규칙에 속한 pretrained 모델을 사용하지 않고 제출하신 분들이 계실 텐데 이러한 상황에 대해 어떻게 하실지 궁금합니다.

로그인이 필요합니다
0 / 1000
DACONIO
2021.12.22 14:20

안녕하세요 때를기다리는자님.

HanBert의 경우 2020년 10월 25일부로 모델의 공개가 중단된 상태로 본 대회에서 사용이 불가능합니다.

감사합니다.
데이콘 드림.

때를기다리는자
2020.11.14 13:45

삭제된 댓글입니다

때를기다리는자
2020.11.14 13:45

현재 HanBert 관련 github은 두 가지가 있습니다.

https://github.com/monologg/HanBert-Transformers

https://github.com/tbai2019/HanBert-54k-N

운영자님이 말씀하시는 HanBert(https://github.com/tbai2019/HanBert-54k-N)로

해당 페이지에서 "HanBERT 54kN 300만 Steps 모델의 공개를 중단합니다. (2020년 10월 25일)"라고 되어 있고

https://github.com/monologg/HanBert-Transformers 에서는 Pretrained 모델을 지금도 받을 수 있습니다.

그래서 저는 300만 steps이 아닌 pretrained 모델은 공개했다고 보고 사용한 것인데요.

이 부분에 대한 답변 부탁드립니다.

그리고 공개된 pretrained 모델로 KoELECTRA가 있습니다.

이 모델은 사용이 불가능한가요?

DACONIO
2020.11.16 10:44

https://github.com/monologg/HanBert-Transformers에서 배포하는 모델은 https://github.com/tbai2019/HanBert-54k-N에서 배포된 모델을 pytorch로 변환한 것으로 원 저작자가 상업적 이용을 금지하였기에 상금이 걸린 경진대회에서는 사용이 불가합니다.

KoELECTRA의 경우 학습 데이터에 나무위키 데이터가 포함 되어있는데 나무위키의 저작권은 영리 목적의 이용이 금지되어 있어 저작권 이슈가 있는지 검토 후 답변드리겠습니다.

DACONIO
2020.11.16 14:06

KoELECTRA 학습에 사용된 데이터 저작권 이슈가 있어 사용이 불가합니다.