Visually-rich Document Understanding : 2025 Samsung AI Challenge

Algorithm | Samsung | Recruit | Multi-Modal | OCR | Document Parsing | Code Submission Evaluation

  • moneyIcon Prize : 21,000,000 KRW
  • 235 Users D-8 to Close

1. 리더보드 산식

  • 평가 산식 : OCR(30%), Layout Detection(35%), Reading Order(35%) 종합 점수 [코드]

Score = 0.3 X OCR + 0.35 X Layout Detection + 0.35 X Reading Order

1) OCR(30%) : 'category_type' 요소 중 'title', 'subtitle', 'text'에 대한 정답 텍스트와 예측 테스트 간의 정규화된 편집 거리 (NED)

  • N : OCR 평가 대상 항목 수
  • NED : Normalized Edit Distance
  • 예측이 없거나 항목 매칭에 실패한 경우, NED = 1로 간주

2) Layout Detection(35%) : 'category_type' 전체 요소의 bbox 탐지 성능

  • IoU 임계값 0.50~0.95(0.05 간격, 총 10개)에서 category_type별 AP를 계산한 후, 이들의 평균 점수

3) Reading Order(35%) : 'category_type' 전체 요소의 정답 순서(order)와 예측 순서(order) 간 정규화된 편집 거리 (NED)

  • Public Score : 전체 테스트 데이터 100% (총 72개의 문서 샘플)


2. 평가 기준

  • 1차 평가 : 대회 종료 시점의 리더보드 Public Score
  • 2차 평가 : 2차 평가 자료를 제출한 1차 평가(Public Score) 점수 기준 상위 10팀에 대한 종합 평가 진행
  • 2차 평가 항목


3. 코드 제출 대회 가이드

본 대회는 submit.zip 파일을 제출하는 방식의 '코드 제출 대회'로 진행됩니다. (기본 가이드 문서)

참가자는 아래와 같은 구조로 submit.zip을 구성하여 제출해야 합니다.

아래의 구조와 동일하고 디렉토리 명과 파일 명을 모두 일치 시켜야합니다.

📁 제출 파일 구조 (submit.zip)

submit.zip
├── model/        # 모델 가중치 파일을 저장하는 디렉토리
│   └── (예: model.pt 등)
├── script.py       # 실제 추론이 수행되는 실행 코드
└── requirements.txt   # 필요한 패키지 및 버전 명시
  • script.py는 submit.zip을 제출 시 평가 서버에서 자동으로 실행됩니다.
  • requirements.txtpip install -r requirements.txt 명령어로 설치 가능한 형태여야 하며, 추론 시 필요한 모든 패키지를 포함해야 합니다.
  • submit.zip 내 구조는 반드시 일치해야하며, 추가 최상위 폴더가 zip 구조 내 존재하는 경우 등 구조가 불일치하는 경우 설치 오류가 발생합니다.


⚙️ 평가 서버에서 추가되는 항목

제출 시, 평가 서버에서 참가자가 제출한 submit.zip 파일에는 아래 항목이 자동으로 추가됩니다.

submit.zip
├── model/        # 참가자 구성
├── script.py       # 참가자 구성
├── requirements.txt   # 참가자 구성
├── data/         # 평가에 사용될 테스트 데이터 (디렉토리 자동 생성)
└── output/submission.csv        # 참가자 추론 결과가 저장되는 경로 (디렉토리 자동 생성)
  • data/ 디렉토리는 실제 평가 데이터를 포함한 경진대회 데이터가 포함되며, 읽기전용으로 쓰기 및 수정이 불가능한 디렉토리입니다.
  • output/ 디렉토리는 참가자의 script.py 실행 결과로 생성된 예측 결과 파일이 저장되는 디렉토리이며, 해당 디렉토리 내에 반드시 submission.csv으로 생성될 수 있어야합니다.


💾 제출 파일 용량 제한

  • 제출 파일(zip) 용량 제한: 최대 10GB 이내


⏱️ 실행 시간 제한

  • 패키지 설치 시간: 최대 10분 이내 (시간 초과 시 설치 오류)
  • 추론 코드 실행 시간: 최대 60분 이내 (시간 초과 시 제출 오류)


⚙️ 평가 서버 사양

  • OS : Ubuntu 22.04.5 LTS
  • GPU: NVIDIA T4 (VRAM 16GB)
  • CPU: 3 vCPU
  • RAM: 12GB
  • Python : 3.10.12
  • CUDA : 12.8 (cuDNN 9)
  • 인터넷 접속: ❌ 비활성화 (패키지 설치 외 외부 서버 연결 및 다운로드 불가)


💾 평가 서버 기본 설치 패키지(라이브러리) 목록

  • 아래의 패키지(라이브러리)는 평가 서버에 기본적으로 설치되어 있으며, 버전이 명시된 아래의 패키지(라이브러리)에 한해서는 다른 버전을 사용할 때 설치 에러가 발생할 수 있으므로 가급적 평가 서버에 기본 설치된 패키지(라이브러리)를 활용하고 제출하는 requirements.txt에는 포함하지 않는 것을 권장드립니다.
  • 라이브러리 설치 에러가 발생하면 설치 오류에 해당하며, 일일 제출 횟수에는 반영되지 않습니다.


1) 주요 설치 패키지(라이브러리)

torch==2.7.1+cu128
torchaudio==2.7.1+cu128
torchvision==0.22.1+cu128
tensorflow==2.19.0
pillow==11.0.0
PyMuPDF==1.24.11
pandas==2.0.3
numpy==1.26.4
faiss-gpu-cu12==1.11.0
langchain==0.1.6
pytesseract==0.3.13
ultralytics==8.3.170
scikit-learn==1.7.1
bitsandbytes==0.46.1
accelerate==1.9.0
transformers==4.46.3
python-pptx==0.6.23
pdfminer.six==20221105
opencv-python==4.9.0.80
pdf2image==1.17.0
sentencepiece==0.1.99
regex==2023.12.25
easyocr==1.7.1
layoutparser==0.3.4
tqdm==4.66.4
loguru==0.7.2
pyyaml==6.0.1
rich==13.7.1
albumentations==1.4.3

2) 주요 설치 시스템 패키지

git
build-essential  
python3.10
python3.10-distutils  
python3-pip  
libffi-dev  
libblas3  
liblapack3  
libomp-dev  
libgl1-mesa-glx  
libopenjp2-7  
libpng-dev  
libjpeg-dev  
tesseract-ocr  
tesseract-ocr-kor  
libreoffice  
poppler-utils  
tzdata  
ffmpeg  
libsm6  
libxext6  
libgl1  
unzip  
p7zip-full  
pdftk  
qpdf  
gfortran  
libatlas-base-dev  


📌 유의사항

  • 제출 시 발생하는 오류의 종류는 두 가지로 정의되며, 일일 제출 횟수 반영에 대한 기준이 다르므로 반드시 숙지하여 진행해야 합니다.
  • 1) 설치 오류 : 제출하는 submit.zip 내부 구조가 불일치한 경우, 패키지 설치 오류 -> 일일 제출 횟수 반영되지 않음
  • 2) 제출 오류 : script.py 코드 실행 후 발생하는 모든 오류 -> 일일 제출 횟수 반영됨
  • script.py 내에서 open/ 디렉토리의 데이터를 로드하고, output/ 디렉토리에 예측 결과를 반드시 submission.csv의 파일명으로 저장되어야 합니다.
  • 평가 서버 환경은 인터넷 접속이 불가능하므로, 패키지 설치 이후 외부 다운로드가 필요한 코드나 모델은 작동하지 않습니다.

Main Event Schedule

  1. 08.04

    Start Date

  2. 09.12

    Team Merger Deadline

  3. 09.12

    Close

1. 리더보드 산식

  • 평가 산식 : OCR(30%), Layout Detection(35%), Reading Order(35%) 종합 점수 [코드]

Score = 0.3 X OCR + 0.35 X Layout Detection + 0.35 X Reading Order

1) OCR(30%) : 'category_type' 요소 중 'title', 'subtitle', 'text'에 대한 정답 텍스트와 예측 테스트 간의 정규화된 편집 거리 (NED)

  • N : OCR 평가 대상 항목 수
  • NED : Normalized Edit Distance
  • 예측이 없거나 항목 매칭에 실패한 경우, NED = 1로 간주

2) Layout Detection(35%) : 'category_type' 전체 요소의 bbox 탐지 성능

  • IoU 임계값 0.50~0.95(0.05 간격, 총 10개)에서 category_type별 AP를 계산한 후, 이들의 평균 점수

3) Reading Order(35%) : 'category_type' 전체 요소의 정답 순서(order)와 예측 순서(order) 간 정규화된 편집 거리 (NED)

  • Public Score : 전체 테스트 데이터 100% (총 72개의 문서 샘플)


2. 평가 기준

  • 1차 평가 : 대회 종료 시점의 리더보드 Public Score
  • 2차 평가 : 2차 평가 자료를 제출한 1차 평가(Public Score) 점수 기준 상위 10팀에 대한 종합 평가 진행
  • 2차 평가 항목


3. 코드 제출 대회 가이드

본 대회는 submit.zip 파일을 제출하는 방식의 '코드 제출 대회'로 진행됩니다. (기본 가이드 문서)

참가자는 아래와 같은 구조로 submit.zip을 구성하여 제출해야 합니다.

아래의 구조와 동일하고 디렉토리 명과 파일 명을 모두 일치 시켜야합니다.

📁 제출 파일 구조 (submit.zip)

submit.zip
├── model/        # 모델 가중치 파일을 저장하는 디렉토리
│   └── (예: model.pt 등)
├── script.py       # 실제 추론이 수행되는 실행 코드
└── requirements.txt   # 필요한 패키지 및 버전 명시
  • script.py는 submit.zip을 제출 시 평가 서버에서 자동으로 실행됩니다.
  • requirements.txtpip install -r requirements.txt 명령어로 설치 가능한 형태여야 하며, 추론 시 필요한 모든 패키지를 포함해야 합니다.
  • submit.zip 내 구조는 반드시 일치해야하며, 추가 최상위 폴더가 zip 구조 내 존재하는 경우 등 구조가 불일치하는 경우 설치 오류가 발생합니다.


⚙️ 평가 서버에서 추가되는 항목

제출 시, 평가 서버에서 참가자가 제출한 submit.zip 파일에는 아래 항목이 자동으로 추가됩니다.

submit.zip
├── model/        # 참가자 구성
├── script.py       # 참가자 구성
├── requirements.txt   # 참가자 구성
├── data/         # 평가에 사용될 테스트 데이터 (디렉토리 자동 생성)
└── output/submission.csv        # 참가자 추론 결과가 저장되는 경로 (디렉토리 자동 생성)
  • data/ 디렉토리는 실제 평가 데이터를 포함한 경진대회 데이터가 포함되며, 읽기전용으로 쓰기 및 수정이 불가능한 디렉토리입니다.
  • output/ 디렉토리는 참가자의 script.py 실행 결과로 생성된 예측 결과 파일이 저장되는 디렉토리이며, 해당 디렉토리 내에 반드시 submission.csv으로 생성될 수 있어야합니다.


💾 제출 파일 용량 제한

  • 제출 파일(zip) 용량 제한: 최대 10GB 이내


⏱️ 실행 시간 제한

  • 패키지 설치 시간: 최대 10분 이내 (시간 초과 시 설치 오류)
  • 추론 코드 실행 시간: 최대 60분 이내 (시간 초과 시 제출 오류)


⚙️ 평가 서버 사양

  • OS : Ubuntu 22.04.5 LTS
  • GPU: NVIDIA T4 (VRAM 16GB)
  • CPU: 3 vCPU
  • RAM: 12GB
  • Python : 3.10.12
  • CUDA : 12.8 (cuDNN 9)
  • 인터넷 접속: ❌ 비활성화 (패키지 설치 외 외부 서버 연결 및 다운로드 불가)


💾 평가 서버 기본 설치 패키지(라이브러리) 목록

  • 아래의 패키지(라이브러리)는 평가 서버에 기본적으로 설치되어 있으며, 버전이 명시된 아래의 패키지(라이브러리)에 한해서는 다른 버전을 사용할 때 설치 에러가 발생할 수 있으므로 가급적 평가 서버에 기본 설치된 패키지(라이브러리)를 활용하고 제출하는 requirements.txt에는 포함하지 않는 것을 권장드립니다.
  • 라이브러리 설치 에러가 발생하면 설치 오류에 해당하며, 일일 제출 횟수에는 반영되지 않습니다.


1) 주요 설치 패키지(라이브러리)

torch==2.7.1+cu128
torchaudio==2.7.1+cu128
torchvision==0.22.1+cu128
tensorflow==2.19.0
pillow==11.0.0
PyMuPDF==1.24.11
pandas==2.0.3
numpy==1.26.4
faiss-gpu-cu12==1.11.0
langchain==0.1.6
pytesseract==0.3.13
ultralytics==8.3.170
scikit-learn==1.7.1
bitsandbytes==0.46.1
accelerate==1.9.0
transformers==4.46.3
python-pptx==0.6.23
pdfminer.six==20221105
opencv-python==4.9.0.80
pdf2image==1.17.0
sentencepiece==0.1.99
regex==2023.12.25
easyocr==1.7.1
layoutparser==0.3.4
tqdm==4.66.4
loguru==0.7.2
pyyaml==6.0.1
rich==13.7.1
albumentations==1.4.3

2) 주요 설치 시스템 패키지

git
build-essential  
python3.10
python3.10-distutils  
python3-pip  
libffi-dev  
libblas3  
liblapack3  
libomp-dev  
libgl1-mesa-glx  
libopenjp2-7  
libpng-dev  
libjpeg-dev  
tesseract-ocr  
tesseract-ocr-kor  
libreoffice  
poppler-utils  
tzdata  
ffmpeg  
libsm6  
libxext6  
libgl1  
unzip  
p7zip-full  
pdftk  
qpdf  
gfortran  
libatlas-base-dev  


📌 유의사항

  • 제출 시 발생하는 오류의 종류는 두 가지로 정의되며, 일일 제출 횟수 반영에 대한 기준이 다르므로 반드시 숙지하여 진행해야 합니다.
  • 1) 설치 오류 : 제출하는 submit.zip 내부 구조가 불일치한 경우, 패키지 설치 오류 -> 일일 제출 횟수 반영되지 않음
  • 2) 제출 오류 : script.py 코드 실행 후 발생하는 모든 오류 -> 일일 제출 횟수 반영됨
  • script.py 내에서 open/ 디렉토리의 데이터를 로드하고, output/ 디렉토리에 예측 결과를 반드시 submission.csv의 파일명으로 저장되어야 합니다.
  • 평가 서버 환경은 인터넷 접속이 불가능하므로, 패키지 설치 이후 외부 다운로드가 필요한 코드나 모델은 작동하지 않습니다.

Main Event Schedule

  1. 08.04

    Start Date
  2. 09.12

    Team Merger Deadline
  3. 09.12

    Close