분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Baseline] Tesseract OCR 엔진을 활용하여 추론해보기
안녕하세요. 데이콘입니다.
데이콘 베이스라인은 모든 참가자의 '제출'을 목표로 합니다.
해당 내용에 관한 질문은 [토크] 게시판에 게시해 주세요.
본 베이스라인은 오픈소스 텍스트 인식 엔진인 Tesseract(PyTesseract)을 활용하여 간단하게 Train Dataset으로 성능을 가늠해보고 Test Dataset으로부터 추론하는 것을 구현하였습니다. (Public accuracy : 0.06)
베이스라인은 참가자 여러분들의 제출을 돕기 위한 코드로, 참고하시거나 새로운 전처리를 적용하여 추론 성능을 높이거나 직접 Fine Tuning 혹은 모델링하여 고도화시키는 등 자유롭게 활용하셔도 무방합니다.
감사합니다.
데이콘 드림
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved