HAI(하이)! - Hecto AI Challenge : 2025 Second Half Hecto Recruitment AI Competition

Recruit | Algorithm | Hecto | Vision | DeepFake | Classification

  • moneyIcon 26,000,000 KRW
  • 1,349 Users Completed

1. 개인 또는 팀 참여 규칙

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • 개인 참가 방법 : 팀 신청 없이, 자유롭게 제출탭에서 제출 가능
  • 팀 참가 방법 : 팀 탭에서 가능, 상세 내용은 팀 탭에서 팀 병합 정책 확인
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 3 명
  • 동일인이 개인 또는 복수팀에 중복하여 등록 불가

  

2. 대회 규칙

1) 이미지 단위 입력 처리 요건

  • 영상(Video) 데이터의 경우 프레임 단위로 분해하여 각 프레임을 개별 이미지로 모델에 입력해야 하며, 복수 프레임을 동시에 모델 입력으로 사용하여 시간적 정보를 직접 활용하는 방식은 허용되지 않습니다.
  • 단, 프레임별로 독립적으로 수행된 추론 결과를 종합하여 최종 결과를 산출하는 후처리 과정은 허용됩니다.

2) 사전 학습 모델 사용 가능 범위

  • 2025년 12월 29일 전(~2025.12.28)에 공식적으로 가중치가 공개된 사전 학습 모델만 사용할 수 있습니다.
  • 또한 해당 모델은 최소 비상업적 이용(NC)이 허용된 라이센스를 따라야 합니다.
  • 본 대회에서는 사전 학습 모델의 사용 가능 여부를 '모델 아키텍처'가 따르는 라이센스 기준으로 판단합니다.
  • 사전 학습 과정에서 사용된 데이터셋의 라이센스 여부와 관계없이, 아키텍처 라이센스가 비상업적 이용조차 허용하지 않는 경우 해당 모델은 사용할 수 없습니다.

3) 외부 데이터 사용 가능

  • 본 경진대회에서는 공식 학습 데이터가 제공되지 않으므로, 참가자는 모델 학습에 필요한 데이터를 직접 수집하거나 생성하여 사용할 수 있습니다.
  • 이때 사용되는 모든 데이터는 저작권·개인정보보호 등 관련 법령을 준수해야 하며, 법적 제약 없이 활용 가능한 데이터만 사용 가능합니다.
  • 외부 데이터 수집·생성을 위한 API 활용은 자유롭게 허용되지만, 해당 API는 모델 학습·추론에 직접 관여하지 않는 범위에서만 사용할 수 있습니다.
  • 또한 외부 데이터를 수집 또는 생성한 경우에는 해당 데이터의 출처와 생성 방식을 명확히 기재하고 데이터를 제출하여, 사용에 법적인 문제가 없음을 증빙할 수 있어야합니다.

4) API 사용 제한

  • 원격 서버를 통해서만 접근 가능한 API 형태의 모델 또는 서비스(예: OpenAI API, Gemini API, 딥페이크 판별 서비스 API 등)를 모델의 학습/추론 과정에 직접 사용하는 것 은 허용되지 않습니다. 
  • 모든 모델은 로컬 환경에서 직접 실행 가능해야 하며, 모델 학습/추론 시 외부 서버에 의존하는 방식은 사용할 수 없습니다.
  • 단, 외부 API를 활용하여 ‘학습 데이터 수집·생성’을 수행하는 것은 허용됩니다. 이 경우, API 호출은 모델 학습 또는 추론 단계에서 직접 사용되지 않아야 하며, 생성된 데이터는 정적 형태로 저장 후 활용해야하며 외부 데이터 사용 규칙을 충족해야합니다.

5) 단일 모델 구성 요건

  • 추론은 반드시 단일 모델을 사용하여 수행해야 하며, 복수의 모델을 조합하거나, 서로 독립적으로 학습된 모델의 출력 또는 임베딩을 결합하는 방식은 허용되지 않습니다.

① 허용 범위

  • 하나의 고정된 모델 아키텍처를 기반으로, 단일 사전학습 모델을 사용하여 수행되는 추론
  • 단일 백본(backbone)으로부터 추출된 feature를 기반으로 한 head 확장 또는 auxiliary head 구성

② 불허 사항

  • 복수의 모델 또는 백본(backbone)을 병렬로 결합하는 구조
  • 서로 독립적으로 학습된 모델의 예측 결과 또는 임베딩을 결합하는 방식
  • 입력 특성에 따라 모델 또는 백본(backbone)을 선택·전환하는 구조
  • Test-Time Augmentation(TTA) 등 반복 추론 후 결과를 결합하는 방식

6) 학습·추론 코드 구성 요건

[학습 코드]

  • 학습 코드는 GPU 종류와 상관 없이 48GB VRAM 내에서 정상 작동해야 합니다.

[추론 코드]

  • 리더보드 결과를 재현할 수 있는 학습·추론 코드는 운영진이 제시한 추론 환경(리소스) 내에서 제한 시간 이내로 정상 작동해야 합니다.

① 추론 시간 제한

  • 전체 평가 데이터셋 기준 총 추론 시간은 1시간(60분)을 초과할 수 없습니다.
  • 추론 시간은 동일한 환경에서 운영진이 추론 코드를 5회 실행하여 측정한 소요 시간의 평균값으로 산정합니다.

② 추론 환경(리소스) [Runpod 링크]

  • GPU: L40S (48GB VRAM)
  • CPU: 16 vCPUs (96GB RAM)
  • DISK: 80GB
  • CUDA: 11.8 ~ 12.6
  • Pytorch: 2.5.0 권장

③ 추론 코드 유의 사항

  • 추론 코드에는 '데이터 전처리', '모델 로드', '모델 추론', '최종 결과 생성'의 전 과정이 모두 포함되어야 합니다.

④ 실행 환경 제약

  • 추론은 인터넷 연결이 차단된 오프라인 환경에서 수행됩니다.
  • 추론 과정 중 외부 서버와의 통신 또는 인터넷 접근은 허용되지 않습니다.


3. 코드 및 발표자료 제출 규칙

  • 대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 발표자료를 dacon@dacon.io 메일로 기한 내에 제출
  • 제출한 코드는 규칙을 준수하고 Private Score 복원이 가능해야 코드 검증 과정을 통과할 수 있습니다.

[코드 관련]

o 본 대회는 2차 평가 대상자는 Docker 기반 재현 가능한 소스 패키지(코드 및 환경 정의 포함)를 제출해야 합니다.

o 2차 평가 대상자는 주최측이 제시하는 프로젝트 코드 구조(.py 기반)에 맞게 반드시 구성해야하며, 세부 구조는 아래를 따라야합니다.

your_submission/                 # 필수요건 (제출 ZIP 최상위 디렉터리)

├── model/                   # 필수요건

│ ├── model.pt                # 필수요건 – 최종 추론에 사용하는 단일 모델 weight 1개

├── src/                     # 희망요건 – 모델/데이터/유틸 모듈 분리

│ ├── models.py              # 희망요건 – 모델 정의

│ ├── dataset.py              # 희망요건 – 데이터 로더/전처리

│ └── utils.py                # 희망요건 – 공통 유틸 함수

├── config/                   # 필수요건

│ ├── config.yaml             # 필수요건 – 하이퍼파라미터, 경로 키, 모델명 등

├── env/                     # 필수요건

│ ├── Dockerfile              # 필수요건 – 제출 Docker 이미지 재현용

│ ├── requirements.txt          # 필수요건 – 추가 Python 라이브러리 목록

│ └── environment.yml          # 희망요건 – 로컬/연구용 conda 환경 정의

├── train_data/                 # 필수요건

│ └── 학습 데이터              # 필수요건 – 학습 데이터(재현용, 데이터 전수), 출처 및 라이선스

├── test_data/                 # 필수요건

│ └── 평가 데이터              # 필수요건 – 경진대회 제공 평가 데이터셋

├── train.py                   # 필수요건 – config, train_data 기반 학습 코드

├── eval.py                   # 희망요건 – 내부 검증용 평가 코드(ROC-AUC 등)

├── inference.py                # 필수요건 – 채점용 추론 엔트리 포인트

└── README.md                # 필수요건 – 전체 구조/환경/실행 방법 설명

[발표자료 관련]

o 2차 평가 항목에 대한 내용을 반드시 포함하여 총 발표 시간 10분 분량으로 작성

o 각 팀 구성원의 역할 명시

o 발표는 '발표자료(PDF)' 파일로 진행 *기술적 오류 방지를 위해 PPT는 허용되지 않음


4. 유의 사항

  • 1일 최대 제출 횟수: 5회
  • 사용 가능 언어: Python
  • 모든 csv 형식의 데이터와 제출 파일은 UTF-8 인코딩을 적용합니다.
  • 대회 종료 후 공개되는 Private 리더보드 랭킹은 최종 순위가 아니며 검증과 2차 평가 이후 최종 수상자가 결정됩니다.
  • 평가 데이터는 추론에만 활용되어야하며, 학습에 활용할 수 없습니다.
  • 규칙 위반 사항이 발견되는 경우에는 실격에 해당합니다.
  • 데이콘은 부정 제출 행위를 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 아래의 링크를 참고해 주시기 바랍니다.

https://dacon.io/notice/notice/13

 

5. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 토크 게시글 댓글로 질문을 올려 주시기 바랍니다.

예) [DACON 답변 요청] 시상식은 언제 열리나요?

Main Event Schedule

  1. 10.28

    Start Date

  2. 11.28

    Team Merger Deadline

  3. 11.28

    Close

  4. Invalid Date

    Submission Deadline

1. 개인 또는 팀 참여 규칙

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • 개인 참가 방법 : 팀 신청 없이, 자유롭게 제출탭에서 제출 가능
  • 팀 참가 방법 : 팀 탭에서 가능, 상세 내용은 팀 탭에서 팀 병합 정책 확인
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 3 명
  • 동일인이 개인 또는 복수팀에 중복하여 등록 불가

  

2. 대회 규칙

1) 이미지 단위 입력 처리 요건

  • 영상(Video) 데이터의 경우 프레임 단위로 분해하여 각 프레임을 개별 이미지로 모델에 입력해야 하며, 복수 프레임을 동시에 모델 입력으로 사용하여 시간적 정보를 직접 활용하는 방식은 허용되지 않습니다.
  • 단, 프레임별로 독립적으로 수행된 추론 결과를 종합하여 최종 결과를 산출하는 후처리 과정은 허용됩니다.

2) 사전 학습 모델 사용 가능 범위

  • 2025년 12월 29일 전(~2025.12.28)에 공식적으로 가중치가 공개된 사전 학습 모델만 사용할 수 있습니다.
  • 또한 해당 모델은 최소 비상업적 이용(NC)이 허용된 라이센스를 따라야 합니다.
  • 본 대회에서는 사전 학습 모델의 사용 가능 여부를 '모델 아키텍처'가 따르는 라이센스 기준으로 판단합니다.
  • 사전 학습 과정에서 사용된 데이터셋의 라이센스 여부와 관계없이, 아키텍처 라이센스가 비상업적 이용조차 허용하지 않는 경우 해당 모델은 사용할 수 없습니다.

3) 외부 데이터 사용 가능

  • 본 경진대회에서는 공식 학습 데이터가 제공되지 않으므로, 참가자는 모델 학습에 필요한 데이터를 직접 수집하거나 생성하여 사용할 수 있습니다.
  • 이때 사용되는 모든 데이터는 저작권·개인정보보호 등 관련 법령을 준수해야 하며, 법적 제약 없이 활용 가능한 데이터만 사용 가능합니다.
  • 외부 데이터 수집·생성을 위한 API 활용은 자유롭게 허용되지만, 해당 API는 모델 학습·추론에 직접 관여하지 않는 범위에서만 사용할 수 있습니다.
  • 또한 외부 데이터를 수집 또는 생성한 경우에는 해당 데이터의 출처와 생성 방식을 명확히 기재하고 데이터를 제출하여, 사용에 법적인 문제가 없음을 증빙할 수 있어야합니다.

4) API 사용 제한

  • 원격 서버를 통해서만 접근 가능한 API 형태의 모델 또는 서비스(예: OpenAI API, Gemini API, 딥페이크 판별 서비스 API 등)를 모델의 학습/추론 과정에 직접 사용하는 것 은 허용되지 않습니다. 
  • 모든 모델은 로컬 환경에서 직접 실행 가능해야 하며, 모델 학습/추론 시 외부 서버에 의존하는 방식은 사용할 수 없습니다.
  • 단, 외부 API를 활용하여 ‘학습 데이터 수집·생성’을 수행하는 것은 허용됩니다. 이 경우, API 호출은 모델 학습 또는 추론 단계에서 직접 사용되지 않아야 하며, 생성된 데이터는 정적 형태로 저장 후 활용해야하며 외부 데이터 사용 규칙을 충족해야합니다.

5) 단일 모델 구성 요건

  • 추론은 반드시 단일 모델을 사용하여 수행해야 하며, 복수의 모델을 조합하거나, 서로 독립적으로 학습된 모델의 출력 또는 임베딩을 결합하는 방식은 허용되지 않습니다.

① 허용 범위

  • 하나의 고정된 모델 아키텍처를 기반으로, 단일 사전학습 모델을 사용하여 수행되는 추론
  • 단일 백본(backbone)으로부터 추출된 feature를 기반으로 한 head 확장 또는 auxiliary head 구성

② 불허 사항

  • 복수의 모델 또는 백본(backbone)을 병렬로 결합하는 구조
  • 서로 독립적으로 학습된 모델의 예측 결과 또는 임베딩을 결합하는 방식
  • 입력 특성에 따라 모델 또는 백본(backbone)을 선택·전환하는 구조
  • Test-Time Augmentation(TTA) 등 반복 추론 후 결과를 결합하는 방식

6) 학습·추론 코드 구성 요건

[학습 코드]

  • 학습 코드는 GPU 종류와 상관 없이 48GB VRAM 내에서 정상 작동해야 합니다.

[추론 코드]

  • 리더보드 결과를 재현할 수 있는 학습·추론 코드는 운영진이 제시한 추론 환경(리소스) 내에서 제한 시간 이내로 정상 작동해야 합니다.

① 추론 시간 제한

  • 전체 평가 데이터셋 기준 총 추론 시간은 1시간(60분)을 초과할 수 없습니다.
  • 추론 시간은 동일한 환경에서 운영진이 추론 코드를 5회 실행하여 측정한 소요 시간의 평균값으로 산정합니다.

② 추론 환경(리소스) [Runpod 링크]

  • GPU: L40S (48GB VRAM)
  • CPU: 16 vCPUs (96GB RAM)
  • DISK: 80GB
  • CUDA: 11.8 ~ 12.6
  • Pytorch: 2.5.0 권장

③ 추론 코드 유의 사항

  • 추론 코드에는 '데이터 전처리', '모델 로드', '모델 추론', '최종 결과 생성'의 전 과정이 모두 포함되어야 합니다.

④ 실행 환경 제약

  • 추론은 인터넷 연결이 차단된 오프라인 환경에서 수행됩니다.
  • 추론 과정 중 외부 서버와의 통신 또는 인터넷 접근은 허용되지 않습니다.


3. 코드 및 발표자료 제출 규칙

  • 대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 발표자료를 dacon@dacon.io 메일로 기한 내에 제출
  • 제출한 코드는 규칙을 준수하고 Private Score 복원이 가능해야 코드 검증 과정을 통과할 수 있습니다.

[코드 관련]

o 본 대회는 2차 평가 대상자는 Docker 기반 재현 가능한 소스 패키지(코드 및 환경 정의 포함)를 제출해야 합니다.

o 2차 평가 대상자는 주최측이 제시하는 프로젝트 코드 구조(.py 기반)에 맞게 반드시 구성해야하며, 세부 구조는 아래를 따라야합니다.

your_submission/                 # 필수요건 (제출 ZIP 최상위 디렉터리)

├── model/                   # 필수요건

│ ├── model.pt                # 필수요건 – 최종 추론에 사용하는 단일 모델 weight 1개

├── src/                     # 희망요건 – 모델/데이터/유틸 모듈 분리

│ ├── models.py              # 희망요건 – 모델 정의

│ ├── dataset.py              # 희망요건 – 데이터 로더/전처리

│ └── utils.py                # 희망요건 – 공통 유틸 함수

├── config/                   # 필수요건

│ ├── config.yaml             # 필수요건 – 하이퍼파라미터, 경로 키, 모델명 등

├── env/                     # 필수요건

│ ├── Dockerfile              # 필수요건 – 제출 Docker 이미지 재현용

│ ├── requirements.txt          # 필수요건 – 추가 Python 라이브러리 목록

│ └── environment.yml          # 희망요건 – 로컬/연구용 conda 환경 정의

├── train_data/                 # 필수요건

│ └── 학습 데이터              # 필수요건 – 학습 데이터(재현용, 데이터 전수), 출처 및 라이선스

├── test_data/                 # 필수요건

│ └── 평가 데이터              # 필수요건 – 경진대회 제공 평가 데이터셋

├── train.py                   # 필수요건 – config, train_data 기반 학습 코드

├── eval.py                   # 희망요건 – 내부 검증용 평가 코드(ROC-AUC 등)

├── inference.py                # 필수요건 – 채점용 추론 엔트리 포인트

└── README.md                # 필수요건 – 전체 구조/환경/실행 방법 설명

[발표자료 관련]

o 2차 평가 항목에 대한 내용을 반드시 포함하여 총 발표 시간 10분 분량으로 작성

o 각 팀 구성원의 역할 명시

o 발표는 '발표자료(PDF)' 파일로 진행 *기술적 오류 방지를 위해 PPT는 허용되지 않음


4. 유의 사항

  • 1일 최대 제출 횟수: 5회
  • 사용 가능 언어: Python
  • 모든 csv 형식의 데이터와 제출 파일은 UTF-8 인코딩을 적용합니다.
  • 대회 종료 후 공개되는 Private 리더보드 랭킹은 최종 순위가 아니며 검증과 2차 평가 이후 최종 수상자가 결정됩니다.
  • 평가 데이터는 추론에만 활용되어야하며, 학습에 활용할 수 없습니다.
  • 규칙 위반 사항이 발견되는 경우에는 실격에 해당합니다.
  • 데이콘은 부정 제출 행위를 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 아래의 링크를 참고해 주시기 바랍니다.

https://dacon.io/notice/notice/13

 

5. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 토크 게시글 댓글로 질문을 올려 주시기 바랍니다.

예) [DACON 답변 요청] 시상식은 언제 열리나요?

Main Event Schedule

  1. 10.28

    Start Date
  2. 11.28

    Team Merger Deadline
  3. 11.28

    Close
  4. Invalid Date

    Submission Deadline