분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Baseline] Tesseract OCR 엔진을 활용하여 추론해보기
안녕하세요. 데이콘입니다.
데이콘 베이스라인은 모든 참가자의 '제출'을 목표로 합니다.
해당 내용에 관한 질문은 [토크] 게시판에 게시해 주세요.
본 베이스라인은 오픈소스 텍스트 인식 엔진인 Tesseract(PyTesseract)을 활용하여 간단하게 Train Dataset으로 성능을 가늠해보고 Test Dataset으로부터 추론하는 것을 구현하였습니다. (Public accuracy : 0.06)
베이스라인은 참가자 여러분들의 제출을 돕기 위한 코드로, 참고하시거나 새로운 전처리를 적용하여 추론 성능을 높이거나 직접 Fine Tuning 혹은 모델링하여 고도화시키는 등 자유롭게 활용하셔도 무방합니다.
감사합니다.
데이콘 드림
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved