line-coupon

데이스쿨 할인 리턴즈

line-coupon-mobile

데이스쿨 할인 리턴즈

2023 교원그룹 AI 챌린지 <본선>

알고리즘 | 본선 | 채용 | 광학문자인식 | Accuracy

상금 1000만 원
21명 마감

마감

대회안내 데이터 코드 공유 토크 리더보드

제출

설명

Dataset Info.

train [폴더]
유아의 손글씨 벡터 학습 데이터
TRAIN_000000.json ~ TRAIN_111714.json
id : 샘플 고유 id
width, height : 샘플의 가로, 세로 크기 (px)
strokes_converted : 각 획을 구성하는 x 좌표의 list와 y 좌표의 list (벡터 정보, Google의 QuickDraw 데이터 참고)
ex) [[[x_a1, x_a2, x_a3, …], [y_a1, y_a2, y_a3, …]], [[x_b1, x_b2, x_b3, …], [y_b1, y_b2, y_b3, …], …]
label : 샘플에 해당하는 Text

test [폴더]
유아의 손글씨 벡터 평가 데이터
TEST_000000.json ~ TEST_114439.json
id : 샘플 고유 id
width, height : 샘플의 가로, 세로 크기 (px)
strokes_converted : 각 획을 구성하는 x 좌표의 list와 y 좌표의 list (벡터 정보, Google의 QuickDraw 데이터 참고)
ex) [[[xa1, xa2, xa3, …], [ya1, ya2, ya3, …]], [[xb1, xb2, xb3, …], [yb1, yb2, yb3, …], …]

sample_submission.csv [제출양식]
utf-8 / utf-8-sig 인코딩으로 생성해야 정상적으로 채점이 가능합니다.
id : 샘플 고유 id
label : 이미지로부터 예측한 Text

학습 데이터의 1글자 샘플의 경우, 1글자 단위의 모든 글자가 평가 데이터에도 존재합니다.
그러나 2글자 이상의 단어의 경우 학습/평가 데이터의 일부에만 존재할 수 있습니다.
모든 Label에 해당하는 Text에는 '공백'이 존재하지 않습니다. (Train / Test 모두 해당)
실제 데이터 특성상 일부 데이터에 노이즈가 존재할 수 있습니다.

상세