Visually-rich Document Understanding : 2025 Samsung AI Challenge

알고리즘 | 삼성 | 채용 | 멀티모달 | OCR | Document Parsing | 코드 제출 평가

  • moneyIcon 상금 : 2,100 만원
  • 220명 종료까지 D-11

1. 리더보드 산식

  • 평가 산식 : OCR(30%), Layout Detection(35%), Reading Order(35%) 종합 점수 [코드]

Score = 0.3 X OCR + 0.35 X Layout Detection + 0.35 X Reading Order

1) OCR(30%) : 'category_type' 요소 중 'title', 'subtitle', 'text'에 대한 정답 텍스트와 예측 테스트 간의 정규화된 편집 거리 (NED)

  • N : OCR 평가 대상 항목 수
  • NED : Normalized Edit Distance
  • 예측이 없거나 항목 매칭에 실패한 경우, NED = 1로 간주

2) Layout Detection(35%) : 'category_type' 전체 요소의 bbox 탐지 성능

  • IoU 임계값 0.50~0.95(0.05 간격, 총 10개)에서 category_type별 AP를 계산한 후, 이들의 평균 점수

3) Reading Order(35%) : 'category_type' 전체 요소의 정답 순서(order)와 예측 순서(order) 간 정규화된 편집 거리 (NED)

  • Public Score : 전체 테스트 데이터 100% (총 72개의 문서 샘플)


2. 평가 기준

  • 1차 평가 : 대회 종료 시점의 리더보드 Public Score
  • 2차 평가 : 2차 평가 자료를 제출한 1차 평가(Public Score) 점수 기준 상위 10팀에 대한 종합 평가 진행
  • 2차 평가 항목


3. 코드 제출 대회 가이드

본 대회는 submit.zip 파일을 제출하는 방식의 '코드 제출 대회'로 진행됩니다. (기본 가이드 문서)

참가자는 아래와 같은 구조로 submit.zip을 구성하여 제출해야 합니다.

아래의 구조와 동일하고 디렉토리 명과 파일 명을 모두 일치 시켜야합니다.

📁 제출 파일 구조 (submit.zip)

submit.zip
├── model/        # 모델 가중치 파일을 저장하는 디렉토리
│   └── (예: model.pt 등)
├── script.py       # 실제 추론이 수행되는 실행 코드
└── requirements.txt   # 필요한 패키지 및 버전 명시
  • script.py는 submit.zip을 제출 시 평가 서버에서 자동으로 실행됩니다.
  • requirements.txtpip install -r requirements.txt 명령어로 설치 가능한 형태여야 하며, 추론 시 필요한 모든 패키지를 포함해야 합니다.
  • submit.zip 내 구조는 반드시 일치해야하며, 추가 최상위 폴더가 zip 구조 내 존재하는 경우 등 구조가 불일치하는 경우 설치 오류가 발생합니다.


⚙️ 평가 서버에서 추가되는 항목

제출 시, 평가 서버에서 참가자가 제출한 submit.zip 파일에는 아래 항목이 자동으로 추가됩니다.

submit.zip
├── model/        # 참가자 구성
├── script.py       # 참가자 구성
├── requirements.txt   # 참가자 구성
├── data/         # 평가에 사용될 테스트 데이터 (디렉토리 자동 생성)
└── output/submission.csv        # 참가자 추론 결과가 저장되는 경로 (디렉토리 자동 생성)
  • data/ 디렉토리는 실제 평가 데이터를 포함한 경진대회 데이터가 포함되며, 읽기전용으로 쓰기 및 수정이 불가능한 디렉토리입니다.
  • output/ 디렉토리는 참가자의 script.py 실행 결과로 생성된 예측 결과 파일이 저장되는 디렉토리이며, 해당 디렉토리 내에 반드시 submission.csv으로 생성될 수 있어야합니다.


💾 제출 파일 용량 제한

  • 제출 파일(zip) 용량 제한: 최대 10GB 이내


⏱️ 실행 시간 제한

  • 패키지 설치 시간: 최대 10분 이내 (시간 초과 시 설치 오류)
  • 추론 코드 실행 시간: 최대 60분 이내 (시간 초과 시 제출 오류)


⚙️ 평가 서버 사양

  • OS : Ubuntu 22.04.5 LTS
  • GPU: NVIDIA T4 (VRAM 16GB)
  • CPU: 3 vCPU
  • RAM: 12GB
  • Python : 3.10.12
  • CUDA : 12.8 (cuDNN 9)
  • 인터넷 접속: ❌ 비활성화 (패키지 설치 외 외부 서버 연결 및 다운로드 불가)


💾 평가 서버 기본 설치 패키지(라이브러리) 목록

  • 아래의 패키지(라이브러리)는 평가 서버에 기본적으로 설치되어 있으며, 버전이 명시된 아래의 패키지(라이브러리)에 한해서는 다른 버전을 사용할 때 설치 에러가 발생할 수 있으므로 가급적 평가 서버에 기본 설치된 패키지(라이브러리)를 활용하고 제출하는 requirements.txt에는 포함하지 않는 것을 권장드립니다.
  • 라이브러리 설치 에러가 발생하면 설치 오류에 해당하며, 일일 제출 횟수에는 반영되지 않습니다.


1) 주요 설치 패키지(라이브러리)

torch==2.7.1+cu128
torchaudio==2.7.1+cu128
torchvision==0.22.1+cu128
tensorflow==2.19.0
pillow==11.0.0
PyMuPDF==1.24.11
pandas==2.0.3
numpy==1.26.4
faiss-gpu-cu12==1.11.0
langchain==0.1.6
pytesseract==0.3.13
ultralytics==8.3.170
scikit-learn==1.7.1
bitsandbytes==0.46.1
accelerate==1.9.0
transformers==4.46.3
python-pptx==0.6.23
pdfminer.six==20221105
opencv-python==4.9.0.80
pdf2image==1.17.0
sentencepiece==0.1.99
regex==2023.12.25
easyocr==1.7.1
layoutparser==0.3.4
tqdm==4.66.4
loguru==0.7.2
pyyaml==6.0.1
rich==13.7.1
albumentations==1.4.3

2) 주요 설치 시스템 패키지

git
build-essential  
python3.10
python3.10-distutils  
python3-pip  
libffi-dev  
libblas3  
liblapack3  
libomp-dev  
libgl1-mesa-glx  
libopenjp2-7  
libpng-dev  
libjpeg-dev  
tesseract-ocr  
tesseract-ocr-kor  
libreoffice  
poppler-utils  
tzdata  
ffmpeg  
libsm6  
libxext6  
libgl1  
unzip  
p7zip-full  
pdftk  
qpdf  
gfortran  
libatlas-base-dev  


📌 유의사항

  • 제출 시 발생하는 오류의 종류는 두 가지로 정의되며, 일일 제출 횟수 반영에 대한 기준이 다르므로 반드시 숙지하여 진행해야 합니다.
  • 1) 설치 오류 : 제출하는 submit.zip 내부 구조가 불일치한 경우, 패키지 설치 오류 -> 일일 제출 횟수 반영되지 않음
  • 2) 제출 오류 : script.py 코드 실행 후 발생하는 모든 오류 -> 일일 제출 횟수 반영됨
  • script.py 내에서 open/ 디렉토리의 데이터를 로드하고, output/ 디렉토리에 예측 결과를 반드시 submission.csv의 파일명으로 저장되어야 합니다.
  • 평가 서버 환경은 인터넷 접속이 불가능하므로, 패키지 설치 이후 외부 다운로드가 필요한 코드나 모델은 작동하지 않습니다.

대회 주요 일정

  1. 08.04

    대회 시작

  2. 09.05

    팀 병합 마감

  3. 09.10

    리더보드 제출 마감

  4. 09.12

    대회 종료

  5. 09.17

    2차 평가 자료 제출 마감

  1. 09.25

    2차 평가 및 검증 마감

  2. 09.26

    최종 결과 발표

1. 리더보드 산식

  • 평가 산식 : OCR(30%), Layout Detection(35%), Reading Order(35%) 종합 점수 [코드]

Score = 0.3 X OCR + 0.35 X Layout Detection + 0.35 X Reading Order

1) OCR(30%) : 'category_type' 요소 중 'title', 'subtitle', 'text'에 대한 정답 텍스트와 예측 테스트 간의 정규화된 편집 거리 (NED)

  • N : OCR 평가 대상 항목 수
  • NED : Normalized Edit Distance
  • 예측이 없거나 항목 매칭에 실패한 경우, NED = 1로 간주

2) Layout Detection(35%) : 'category_type' 전체 요소의 bbox 탐지 성능

  • IoU 임계값 0.50~0.95(0.05 간격, 총 10개)에서 category_type별 AP를 계산한 후, 이들의 평균 점수

3) Reading Order(35%) : 'category_type' 전체 요소의 정답 순서(order)와 예측 순서(order) 간 정규화된 편집 거리 (NED)

  • Public Score : 전체 테스트 데이터 100% (총 72개의 문서 샘플)


2. 평가 기준

  • 1차 평가 : 대회 종료 시점의 리더보드 Public Score
  • 2차 평가 : 2차 평가 자료를 제출한 1차 평가(Public Score) 점수 기준 상위 10팀에 대한 종합 평가 진행
  • 2차 평가 항목


3. 코드 제출 대회 가이드

본 대회는 submit.zip 파일을 제출하는 방식의 '코드 제출 대회'로 진행됩니다. (기본 가이드 문서)

참가자는 아래와 같은 구조로 submit.zip을 구성하여 제출해야 합니다.

아래의 구조와 동일하고 디렉토리 명과 파일 명을 모두 일치 시켜야합니다.

📁 제출 파일 구조 (submit.zip)

submit.zip
├── model/        # 모델 가중치 파일을 저장하는 디렉토리
│   └── (예: model.pt 등)
├── script.py       # 실제 추론이 수행되는 실행 코드
└── requirements.txt   # 필요한 패키지 및 버전 명시
  • script.py는 submit.zip을 제출 시 평가 서버에서 자동으로 실행됩니다.
  • requirements.txtpip install -r requirements.txt 명령어로 설치 가능한 형태여야 하며, 추론 시 필요한 모든 패키지를 포함해야 합니다.
  • submit.zip 내 구조는 반드시 일치해야하며, 추가 최상위 폴더가 zip 구조 내 존재하는 경우 등 구조가 불일치하는 경우 설치 오류가 발생합니다.


⚙️ 평가 서버에서 추가되는 항목

제출 시, 평가 서버에서 참가자가 제출한 submit.zip 파일에는 아래 항목이 자동으로 추가됩니다.

submit.zip
├── model/        # 참가자 구성
├── script.py       # 참가자 구성
├── requirements.txt   # 참가자 구성
├── data/         # 평가에 사용될 테스트 데이터 (디렉토리 자동 생성)
└── output/submission.csv        # 참가자 추론 결과가 저장되는 경로 (디렉토리 자동 생성)
  • data/ 디렉토리는 실제 평가 데이터를 포함한 경진대회 데이터가 포함되며, 읽기전용으로 쓰기 및 수정이 불가능한 디렉토리입니다.
  • output/ 디렉토리는 참가자의 script.py 실행 결과로 생성된 예측 결과 파일이 저장되는 디렉토리이며, 해당 디렉토리 내에 반드시 submission.csv으로 생성될 수 있어야합니다.


💾 제출 파일 용량 제한

  • 제출 파일(zip) 용량 제한: 최대 10GB 이내


⏱️ 실행 시간 제한

  • 패키지 설치 시간: 최대 10분 이내 (시간 초과 시 설치 오류)
  • 추론 코드 실행 시간: 최대 60분 이내 (시간 초과 시 제출 오류)


⚙️ 평가 서버 사양

  • OS : Ubuntu 22.04.5 LTS
  • GPU: NVIDIA T4 (VRAM 16GB)
  • CPU: 3 vCPU
  • RAM: 12GB
  • Python : 3.10.12
  • CUDA : 12.8 (cuDNN 9)
  • 인터넷 접속: ❌ 비활성화 (패키지 설치 외 외부 서버 연결 및 다운로드 불가)


💾 평가 서버 기본 설치 패키지(라이브러리) 목록

  • 아래의 패키지(라이브러리)는 평가 서버에 기본적으로 설치되어 있으며, 버전이 명시된 아래의 패키지(라이브러리)에 한해서는 다른 버전을 사용할 때 설치 에러가 발생할 수 있으므로 가급적 평가 서버에 기본 설치된 패키지(라이브러리)를 활용하고 제출하는 requirements.txt에는 포함하지 않는 것을 권장드립니다.
  • 라이브러리 설치 에러가 발생하면 설치 오류에 해당하며, 일일 제출 횟수에는 반영되지 않습니다.


1) 주요 설치 패키지(라이브러리)

torch==2.7.1+cu128
torchaudio==2.7.1+cu128
torchvision==0.22.1+cu128
tensorflow==2.19.0
pillow==11.0.0
PyMuPDF==1.24.11
pandas==2.0.3
numpy==1.26.4
faiss-gpu-cu12==1.11.0
langchain==0.1.6
pytesseract==0.3.13
ultralytics==8.3.170
scikit-learn==1.7.1
bitsandbytes==0.46.1
accelerate==1.9.0
transformers==4.46.3
python-pptx==0.6.23
pdfminer.six==20221105
opencv-python==4.9.0.80
pdf2image==1.17.0
sentencepiece==0.1.99
regex==2023.12.25
easyocr==1.7.1
layoutparser==0.3.4
tqdm==4.66.4
loguru==0.7.2
pyyaml==6.0.1
rich==13.7.1
albumentations==1.4.3

2) 주요 설치 시스템 패키지

git
build-essential  
python3.10
python3.10-distutils  
python3-pip  
libffi-dev  
libblas3  
liblapack3  
libomp-dev  
libgl1-mesa-glx  
libopenjp2-7  
libpng-dev  
libjpeg-dev  
tesseract-ocr  
tesseract-ocr-kor  
libreoffice  
poppler-utils  
tzdata  
ffmpeg  
libsm6  
libxext6  
libgl1  
unzip  
p7zip-full  
pdftk  
qpdf  
gfortran  
libatlas-base-dev  


📌 유의사항

  • 제출 시 발생하는 오류의 종류는 두 가지로 정의되며, 일일 제출 횟수 반영에 대한 기준이 다르므로 반드시 숙지하여 진행해야 합니다.
  • 1) 설치 오류 : 제출하는 submit.zip 내부 구조가 불일치한 경우, 패키지 설치 오류 -> 일일 제출 횟수 반영되지 않음
  • 2) 제출 오류 : script.py 코드 실행 후 발생하는 모든 오류 -> 일일 제출 횟수 반영됨
  • script.py 내에서 open/ 디렉토리의 데이터를 로드하고, output/ 디렉토리에 예측 결과를 반드시 submission.csv의 파일명으로 저장되어야 합니다.
  • 평가 서버 환경은 인터넷 접속이 불가능하므로, 패키지 설치 이후 외부 다운로드가 필요한 코드나 모델은 작동하지 않습니다.

대회 주요 일정

  1. 08.04

    대회 시작
  2. 09.05

    팀 병합 마감
  3. 09.10

    리더보드 제출 마감
  4. 09.12

    대회 종료
  5. 09.17

    2차 평가 자료 제출 마감
  6. 09.25

    2차 평가 및 검증 마감
  7. 09.26

    최종 결과 발표