2023 교원그룹 AI OCR 챌린지

알고리즘 | 채용 | 광학문자인식 | Accuracy

상금 : 1,000 만원
1,325명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

심심해서 써보는 대회 관련 Ref

Redix6

2022.12.28 17:45 4,172 조회

papers with code 의

Optical Character Recognition on Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study

벤치마킹에서 베이스라인인 CRNN과 순위권 모델들의 점수

MaskOCR이라는게 성능이 좋아보이네요. 하지만 구현이 된 github은 없습니다.

TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models

베이스라인은 RNN과 위 MaskOCR등 다른모델과의 비교

hugging face에서 사용할 수 있는 모델입니다.

Microsoft에서 발표한 것 같습니다.

https://github.com/microsoft/unilm/tree/master/trocr

https://huggingface.co/docs/transformers/model_doc/trocr

https://paperswithcode.com/sota/optical-character-recognition-on-benchmarking

Augmentation.

어떤 augmentation을 사용해 볼 수 있을까요?

너무 많은 Rotation은 혼란을 줄 수 있을 것 같습니다.

'문'을 90도 회전 시키면 '곰'을 회전시킨 건지 '문' 을 회전시킨 것인지 알기 힘들 수 있겠습니다.

cut mix 처럼 합치는 방법도 생각 해 볼 수 있겠습니다.

'빨간색' 이라는 글자와 '꽃' 이라는 글자가 각각 있다면 '빨간색 꽃' 으로 이미지를 합쳐 볼 수 도 있겠네요.

색을 변환 시키는것도 나쁘지 않을 것 같습니다.

아예 gray scale로 만들어서 threshold 로 black and white로 전처리 할 수 도 있겠네요.

댓글 1개

로그인이 필요합니다

comment

0 / 1000

도비콘

2023.01.20 15:03

🤜🏻🤛🏽

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동하였습니다!

목록으로

<예선> Private 리더보드 공개 및 차후 일정 안내

대회 - 2023 교원그룹 AI OCR 챌린지

2년 전

현재 글

심심해서 써보는 대회 관련 Ref

대회 - 2023 교원그룹 AI OCR 챌린지

2년 전

DAKER! 대회 관련 문의

대회 - 2023 교원그룹 AI OCR 챌린지

2년 전