2023 교원그룹 AI OCR 챌린지

알고리즘 | 채용 | 광학문자인식 | Accuracy

  • moneyIcon Prize : 1,000 만원
  • 1,333명 마감

Description

Dataset Info.

  • train [폴더]
  • 폰트 손글씨 학습 데이터
  • TRAIN_00000.png ~ TRAIN_76887.png


  • test [폴더]
  • 폰트 손글씨 평가 데이터
  • TEST_00000.png ~ TEST_74120.png


  • train.csv [파일]
  • id : 샘플 고유 id
  • img_path : 샘플 이미지 파일 경로
  • label : 샘플 이미지에 해당하는 Text


  • test.csv [파일]
  • id : 샘플 고유 id
  • img_path : 샘플 이미지 파일 경로


  • sample_submission.csv [제출양식]
  • utf-8 / utf-8-sig 인코딩으로 생성해야 정상적으로 채점이 가능합니다.
  • id : 샘플 고유 id
  • label : 이미지로부터 예측한 Text


  • 학습 데이터의 1글자 샘플의 경우, 1글자 단위의 모든 글자가 평가 데이터에도 존재합니다.
  • 그러나 2글자 이상의 단어의 경우 학습/평가 데이터의 일부에만 존재할 수 있습니다.
  • 모든 Label에 해당하는 Text에는 '공백'이 존재하지 않습니다. (Train / Test 모두 해당)


More Data