재정정보 AI 검색 알고리즘 경진대회

알고리즘 | NLP | 생성형 AI | LLM | 질의응답 | F1 Score

  • moneyIcon Prize : 1,000만원
  • 1,038명 마감

Description

Dataset Info.

  • train_source [폴더]
  • 16개의 PDF 파일
  • Source에서 여러 질문-답변 쌍을 추출


  • test_source [폴더]
  • 9개의 PDF 파일
  • Source에서 여러 질문-답변 쌍을 추출하여, Inference를 위한 질문만 제공


  • train.csv [파일]
  • SAMPLE_ID : 샘플 별 식별 ID
  • Source : 질문-답변의 원천이 되는 Source PDF 파일명
  • Source_path : 질문-답변의 원천이 되는 Source PDF 파일 경로
  • Question : Source로부터 추출된 질문
  • Answer : Source로부터 추출된 질문에 대한 정답(답변)


  • test.csv [파일]
  • SAMPLE_ID : 샘플 별 식별 ID
  • Source : 질문-답변의 원천이 되는 Source PDF 파일명
  • Source_path : 질문-답변의 원천이 되는 Source PDF 파일 경로
  • Question : Source로부터 추출된 질문


  • sample_submission.csv [파일] - 제출 양식
  • SAMPLE_ID : 샘플 별 식별 ID
  • Answer : 질문에 대해 생성된 정답(답변)

※ 생성된 정답 중 NULL (빈 값)이 존재하는 경우, 제출이 불가능합니다.



※ 제공드리는 데이터를 엑셀로 열람하는 경우, 데이터가 비정상적으로 보이는 현상이 발생할 수 있으니 반드시 Pandas패키지와 같은 데이터툴을 이용하여 열람부탁드립니다.

More Data