도배 하자 질의 응답 처리 : 한솔데코 시즌2 AI 경진대회

알고리즘 | 언어 | 생성형 AI | LLM | MLOps | QA | Cosine Similarity

  • moneyIcon Prize : 1,000만 원
  • 1,460명 마감

Description

Dataset Info.

  • train.csv [파일]
  • id : 질문 - 답변 (QA) 샘플 고유 번호
  • 질문_1, 질문_2 : 샘플 별 동일한 내용으로 구성된 질문 2개
  • category : 질문 - 답변 (QA) 샘플의 도메인 세부 분야
  • 답변_1, 답변_2, 답변_3, 답변_4, 답변_5 : 샘플 별 질문에 대한 동일한 답변 Reference 5개


  • test.csv [파일]
  • id : 평가 질문 샘플 고유 번호
  • 질문 : 평가 샘플의 질의 내용


  • sample_submission.csv [파일] - 제출 양식
  • id : 평가 질문 샘플 고유 번호
  • vec_0, vec_1 ... vec_511 : 생성된 답변을 512 차원의 Embedding Vector로 표현된 결과



※ 제공드리는 데이터를 엑셀로 열람하는 경우, 데이터가 비정상적으로 보이는 현상이 발생할 수 있으니 반드시 Pandas패키지와 같은 데이터툴을 이용하여 열람부탁드립니다.

More Data