2023 교원그룹 AI 챌린지 <본선>

알고리즘 | 본선 | 채용 | 광학문자인식 | Accuracy

  • moneyIcon 상금 : 1000 만원
  • 21명 마감
마감

설명

Dataset Info.

  • train [폴더]
  • 유아의 손글씨 벡터 학습 데이터
  • TRAIN_000000.json ~ TRAIN_111714.json
  • id : 샘플 고유 id
  • width, height : 샘플의 가로, 세로 크기 (px)
  • strokes_converted : 각 획을 구성하는 x 좌표의 list와 y 좌표의 list (벡터 정보, Google의 QuickDraw 데이터 참고)
  • ex) [[[xa1, xa2, xa3, …], [ya1, ya2, ya3, …]], [[xb1, xb2, xb3, …], [yb1, yb2, yb3, …], …]
  • label : 샘플에 해당하는 Text


  • test [폴더]
  • 유아의 손글씨 벡터 평가 데이터
  • TEST_000000.json ~ TEST_114439.json
  • id : 샘플 고유 id
  • width, height : 샘플의 가로, 세로 크기 (px)
  • strokes_converted : 각 획을 구성하는 x 좌표의 list와 y 좌표의 list (벡터 정보, Google의 QuickDraw 데이터 참고)
  • ex) [[[xa1, xa2, xa3, …], [ya1, ya2, ya3, …]], [[xb1, xb2, xb3, …], [yb1, yb2, yb3, …], …]


  • sample_submission.csv [제출양식]
  • utf-8 / utf-8-sig 인코딩으로 생성해야 정상적으로 채점이 가능합니다.
  • id : 샘플 고유 id
  • label : 이미지로부터 예측한 Text


  • 학습 데이터의 1글자 샘플의 경우, 1글자 단위의 모든 글자가 평가 데이터에도 존재합니다.
  • 그러나 2글자 이상의 단어의 경우 학습/평가 데이터의 일부에만 존재할 수 있습니다.
  • 모든 Label에 해당하는 Text에는 '공백'이 존재하지 않습니다. (Train / Test 모두 해당)
  • 실제 데이터 특성상 일부 데이터에 노이즈가 존재할 수 있습니다.


상세