한국어 문서 생성요약 AI 경진대회

알고리즘 | 텍스트 | 생성요약 | 언어 | ROUGE-N

  • moneyIcon Prize : 총 1,000만원
  • 628명 마감

Description

1. train.jsonl - 학습에 사용 할 데이터셋

- media : 기사 미디어

- id : 각 데이터 고유 번호

- article_original : 전체 기사 내용, 문장별로 split되어 있음

- abstractive : 사람이 생성한 요약문

- extractive : 사람이 추출한 요약문 3개의 index


2. abstractive_test.jsonl - 추론할 데이터셋

- media : 기사 미디어

- id : 각 데이터 고유 번호

- article_original : 전체 기사 내용, 문장별로 split되어 있음


3. abstractive_sample_submission.csv - abstractive_test.jsonl의 추론 결과를 작성하여 제출

- id : abstractive_test.jsonl 데이터의 고유 번호

- summary : 모델이 추론한 문장

More Data