분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Score = 0.3 X OCR + 0.35 X Layout Detection + 0.35 X Reading Order
1) OCR(30%) : 'category_type' 요소 중 'title', 'subtitle', 'text'에 대한 정답 텍스트와 예측 테스트 간의 정규화된 편집 거리 (NED)
2) Layout Detection(35%) : 'category_type' 전체 요소의 bbox 탐지 성능
3) Reading Order(35%) : 'category_type' 전체 요소의 정답 순서(order)와 예측 순서(order) 간 정규화된 편집 거리 (NED)
본 대회는 submit.zip 파일을 제출하는 방식의 '코드 제출 대회'로 진행됩니다. (기본 가이드 문서)
참가자는 아래와 같은 구조로 submit.zip
을 구성하여 제출해야 합니다.
아래의 구조와 동일하고 디렉토리 명과 파일 명을 모두 일치 시켜야합니다.
📁 제출 파일 구조 (submit.zip)
submit.zip
├── model/ # 모델 가중치 파일을 저장하는 디렉토리
│ └── (예: model.pt 등)
├── script.py # 실제 추론이 수행되는 실행 코드
└── requirements.txt # 필요한 패키지 및 버전 명시
script.py
는 submit.zip을 제출 시 평가 서버에서 자동으로 실행됩니다.requirements.txt
는 pip install -r requirements.txt
명령어로 설치 가능한 형태여야 하며, 추론 시 필요한 모든 패키지를 포함해야 합니다.제출 시, 평가 서버에서 참가자가 제출한 submit.zip
파일에는 아래 항목이 자동으로 추가됩니다.
submit.zip
├── model/ # 참가자 구성
├── script.py # 참가자 구성
├── requirements.txt # 참가자 구성
├── data/ # 평가에 사용될 테스트 데이터 (디렉토리 자동 생성)
└── output/submission.csv # 참가자 추론 결과가 저장되는 경로 (디렉토리 자동 생성)
data/
디렉토리는 실제 평가 데이터를 포함한 경진대회 데이터가 포함되며, 읽기전용으로 쓰기 및 수정이 불가능한 디렉토리입니다.output/
디렉토리는 참가자의 script.py
실행 결과로 생성된 예측 결과 파일이 저장되는 디렉토리이며, 해당 디렉토리 내에 반드시 submission.csv
으로 생성될 수 있어야합니다.💾 제출 파일 용량 제한
💾 평가 서버 기본 설치 패키지(라이브러리) 목록
1) 주요 설치 패키지(라이브러리)
torch==2.7.1+cu128
torchaudio==2.7.1+cu128
torchvision==0.22.1+cu128
tensorflow==2.19.0
pillow==11.0.0
PyMuPDF==1.24.11
pandas==2.0.3
numpy==1.26.4
faiss-gpu-cu12==1.11.0
langchain==0.1.6
pytesseract==0.3.13
ultralytics==8.3.170
scikit-learn==1.7.1
bitsandbytes==0.46.1
accelerate==1.9.0
transformers==4.46.3
python-pptx==0.6.23
pdfminer.six==20221105
opencv-python==4.9.0.80
pdf2image==1.17.0
sentencepiece==0.1.99
regex==2023.12.25
easyocr==1.7.1
layoutparser==0.3.4
tqdm==4.66.4
loguru==0.7.2
pyyaml==6.0.1
rich==13.7.1
albumentations==1.4.3
2) 주요 설치 시스템 패키지
git
build-essential
python3.10
python3.10-distutils
python3-pip
libffi-dev
libblas3
liblapack3
libomp-dev
libgl1-mesa-glx
libopenjp2-7
libpng-dev
libjpeg-dev
tesseract-ocr
tesseract-ocr-kor
libreoffice
poppler-utils
tzdata
ffmpeg
libsm6
libxext6
libgl1
unzip
p7zip-full
pdftk
qpdf
gfortran
libatlas-base-dev
script.py
내에서 open/
디렉토리의 데이터를 로드하고, output/
디렉토리에 예측 결과를 반드시 submission.csv의 파일명으로 저장되어야 합니다.대회 시작
팀 병합 마감
리더보드 제출 마감
대회 종료
2차 평가 자료 제출 마감
2차 평가 및 검증 마감
최종 결과 발표
Score = 0.3 X OCR + 0.35 X Layout Detection + 0.35 X Reading Order
1) OCR(30%) : 'category_type' 요소 중 'title', 'subtitle', 'text'에 대한 정답 텍스트와 예측 테스트 간의 정규화된 편집 거리 (NED)
2) Layout Detection(35%) : 'category_type' 전체 요소의 bbox 탐지 성능
3) Reading Order(35%) : 'category_type' 전체 요소의 정답 순서(order)와 예측 순서(order) 간 정규화된 편집 거리 (NED)
본 대회는 submit.zip 파일을 제출하는 방식의 '코드 제출 대회'로 진행됩니다. (기본 가이드 문서)
참가자는 아래와 같은 구조로 submit.zip
을 구성하여 제출해야 합니다.
아래의 구조와 동일하고 디렉토리 명과 파일 명을 모두 일치 시켜야합니다.
📁 제출 파일 구조 (submit.zip)
submit.zip
├── model/ # 모델 가중치 파일을 저장하는 디렉토리
│ └── (예: model.pt 등)
├── script.py # 실제 추론이 수행되는 실행 코드
└── requirements.txt # 필요한 패키지 및 버전 명시
script.py
는 submit.zip을 제출 시 평가 서버에서 자동으로 실행됩니다.requirements.txt
는 pip install -r requirements.txt
명령어로 설치 가능한 형태여야 하며, 추론 시 필요한 모든 패키지를 포함해야 합니다.제출 시, 평가 서버에서 참가자가 제출한 submit.zip
파일에는 아래 항목이 자동으로 추가됩니다.
submit.zip
├── model/ # 참가자 구성
├── script.py # 참가자 구성
├── requirements.txt # 참가자 구성
├── data/ # 평가에 사용될 테스트 데이터 (디렉토리 자동 생성)
└── output/submission.csv # 참가자 추론 결과가 저장되는 경로 (디렉토리 자동 생성)
data/
디렉토리는 실제 평가 데이터를 포함한 경진대회 데이터가 포함되며, 읽기전용으로 쓰기 및 수정이 불가능한 디렉토리입니다.output/
디렉토리는 참가자의 script.py
실행 결과로 생성된 예측 결과 파일이 저장되는 디렉토리이며, 해당 디렉토리 내에 반드시 submission.csv
으로 생성될 수 있어야합니다.💾 제출 파일 용량 제한
💾 평가 서버 기본 설치 패키지(라이브러리) 목록
1) 주요 설치 패키지(라이브러리)
torch==2.7.1+cu128
torchaudio==2.7.1+cu128
torchvision==0.22.1+cu128
tensorflow==2.19.0
pillow==11.0.0
PyMuPDF==1.24.11
pandas==2.0.3
numpy==1.26.4
faiss-gpu-cu12==1.11.0
langchain==0.1.6
pytesseract==0.3.13
ultralytics==8.3.170
scikit-learn==1.7.1
bitsandbytes==0.46.1
accelerate==1.9.0
transformers==4.46.3
python-pptx==0.6.23
pdfminer.six==20221105
opencv-python==4.9.0.80
pdf2image==1.17.0
sentencepiece==0.1.99
regex==2023.12.25
easyocr==1.7.1
layoutparser==0.3.4
tqdm==4.66.4
loguru==0.7.2
pyyaml==6.0.1
rich==13.7.1
albumentations==1.4.3
2) 주요 설치 시스템 패키지
git
build-essential
python3.10
python3.10-distutils
python3-pip
libffi-dev
libblas3
liblapack3
libomp-dev
libgl1-mesa-glx
libopenjp2-7
libpng-dev
libjpeg-dev
tesseract-ocr
tesseract-ocr-kor
libreoffice
poppler-utils
tzdata
ffmpeg
libsm6
libxext6
libgl1
unzip
p7zip-full
pdftk
qpdf
gfortran
libatlas-base-dev
script.py
내에서 open/
디렉토리의 데이터를 로드하고, output/
디렉토리에 예측 결과를 반드시 submission.csv의 파일명으로 저장되어야 합니다.08.04
대회 시작09.05
팀 병합 마감09.10
리더보드 제출 마감09.12
대회 종료09.17
2차 평가 자료 제출 마감09.25
2차 평가 및 검증 마감09.26
최종 결과 발표
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved