한국어 문서 추출요약 AI 경진대회

알고리즘 | 텍스트 | 생성요약 | 언어 | ROUGE-N

  • moneyIcon Prize : 총 1,000만원
  • 1,205명 마감

Description

1. train.jsonl - 학습에 사용 할 데이터셋

- media : 기사 미디어

- id : 각 데이터 고유 번호

- article_original : 전체 기사 내용, 문장별로 split되어 있음

- abstractive : 사람이 생성한 요약문

- extractive : 사람이 추출한 요약문 3개의 index


2. extractive_test.jsonl - 추론할 데이터셋

- media : 기사 미디어

- id : 각 데이터 고유 번호

- article_original : 전체 기사 내용, 문장별로 split되어 있음


3. extractive_sample_submission.csv - extractive_test.jsonl의 추론 결과를 작성하여 제출

- id : extractive_test.jsonl 데이터의 고유 번호

- summary : 모델이 추론한 3개의 추출 문장, 하나의 셀에 각 문장을 로 구분하여 제출

More Data