HD현대 AI Challenge

알고리즘 | 채용 | 정형 | 조선해양 | 회귀 | MAE

  • moneyIcon Prize : 2,000만 원
  • 1,614명 마감

1. 리더 보드 (예선)

  • 평가 산식 : MAE (Mean Absolute Error, 평균 절대 오차)
  • Public score : 전체 테스트 데이터 중 30%
  • Private score : 전체 테스트 데이터 중 70%


2. 평가 방식

  • 예선 평가 : 리더보드 Private Score 100%
  • Private Score는 대회 종료 후 일괄 채점하여 공개
  • 동점자의 경우, 기존 리더보드 순위 산정 방식을 따름 [링크]의 '리더보드 점수' 부분을 참고
  • 코드 제출을 완료하고 코드 검증을 통과한 Private Score 상위 15팀(학생)이 본선 진출


3. 개인 또는 팀 참여 규칙

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • HD현대 그룹사 임직원의 경우 닉네임/팀명 앞에 "[HD현대]" 기재 必
  • 개인 참가 방법 : 팀 신청 없이, 자유롭게 제출탭에서 제출 가능
  • 팀 참가 방법 : 팀 탭에서 가능, 상세 내용은 팀 탭에서 팀 병합 정책 확인
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 3 명
  • 동일인이 개인 또는 복수팀에 중복하여 등록 불가

  

4. 외부 데이터 및 사전 학습 모델

  • 사용에 법적 제약이 없으며, 누구나 변경, 재배포할 수 있는 공개된 외부 데이터 사용 가능
  • 이전 배포되었던 AI 챌린지 대회 데이터셋을 외부 데이터로 사용하는 것은 불가능 (적발 시 실격)
  • 단순 외부에서 수집한 유가 정보는 활용 가능합니다. 단, Data Leakage 규칙에 유의하여 활용해주세요.
  • Row 내 존재하는 ATA 시점보다 과거의 유가 정보만 활용 가능
  • 법적 제약이 없으며 논문으로 공개된 베이스의 사전 학습 모델(Pre-trained Model) 사용 가능
  • 이전 배포되었던 AI 챌린지 대회 데이터셋으로 학습된 모델을 사전 학습 모델로 사용 시 실격 및 리더보드 삭제

 

5. 예선 코드 제출 규칙

  • 예선 종료 후 본선 진출을 희망하는 팀은 아래의 양식에 맞추어 예선 알고리즘 부문 코드를 dacon@dacon.io 메일로 기한 내에 제출
  • 제출한 코드는 Private Score 복원이 가능해야 함

o  코드에 ‘/data’ 데이터 입/출력 경로 포함

o  코드 파일 확장자: .R, .rmd, .py, .ipynb

o  코드와 주석 인코딩: UTF-8

o  모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)

o  개발 환경(OS) 및 라이브러리 버전 기재

  • 제출 파일 목록

o  Private Score 복원이 가능한 코드 파일

o Private Score 복원이 가능한 모델 weight 파일

o [외부 데이터 사용 시] 외부 데이터 파일

o [학생 팀의 경우] 팀원 전체의 재학증명서 또는 대체인증서류 제출


6. 유의 사항

  • 1일 최대 제출 횟수: 10 회
  • 사용 가능 언어: Python
  • 모든 csv 형식의 데이터와 제출 파일은 UTF-8 인코딩을 적용합니다.
  • [23.10.17 추가] 데이터 수정 배포 이전 데이터셋 활용 시 실격 및 리더보드 삭제
  • [23.10.17 추가] 데이터 수정 배포 이전 데이터셋으로 학습된 모델 활용 시 실격 및 리더보드 삭제
  • 모델 학습과 추론에서 평가 데이터셋 정보 활용(Data Leakage)시 본선 진출 불가능
  • 평가 데이터셋(Test Dataset)의 Row의 개수 혹은 Index (그 밖의 Test Dataset에 대한 정보)를 활용하는 것은 Data Leakage에 해당됩니다.
  • 평가 데이터셋의 2개 이상의 Row로부터 얻는 Rolling 연산 불가능
  • 일반적으로 Test Dataset은 '아예 볼 수 없다' 라고 가정하고 진행해야하며 코드 역시 이를 반영해야합니다.
  • 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
  • 제공한 학습 데이터로부터 모델 학습의 과정이 필수적으로 존재해야함
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 1개를 선택해야 함
  • 데이콘은 부정 제출 행위를 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 아래의 링크를 참고해 주시기 바랍니다.

https://dacon.io/notice/notice/13

 

7. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 토크 게시글 댓글로 질문을 올려 주시기 바랍니다.

예) [DACON 답변 요청] 시상식은 언제 열리나요?


Main Event Schedule

  1. 08.30

    Start Date

  2. 09.30

    Team Merger Deadline

  3. 09.30

    Close

1. 리더 보드 (예선)

  • 평가 산식 : MAE (Mean Absolute Error, 평균 절대 오차)
  • Public score : 전체 테스트 데이터 중 30%
  • Private score : 전체 테스트 데이터 중 70%


2. 평가 방식

  • 예선 평가 : 리더보드 Private Score 100%
  • Private Score는 대회 종료 후 일괄 채점하여 공개
  • 동점자의 경우, 기존 리더보드 순위 산정 방식을 따름 [링크]의 '리더보드 점수' 부분을 참고
  • 코드 제출을 완료하고 코드 검증을 통과한 Private Score 상위 15팀(학생)이 본선 진출


3. 개인 또는 팀 참여 규칙

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • HD현대 그룹사 임직원의 경우 닉네임/팀명 앞에 "[HD현대]" 기재 必
  • 개인 참가 방법 : 팀 신청 없이, 자유롭게 제출탭에서 제출 가능
  • 팀 참가 방법 : 팀 탭에서 가능, 상세 내용은 팀 탭에서 팀 병합 정책 확인
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 3 명
  • 동일인이 개인 또는 복수팀에 중복하여 등록 불가

  

4. 외부 데이터 및 사전 학습 모델

  • 사용에 법적 제약이 없으며, 누구나 변경, 재배포할 수 있는 공개된 외부 데이터 사용 가능
  • 이전 배포되었던 AI 챌린지 대회 데이터셋을 외부 데이터로 사용하는 것은 불가능 (적발 시 실격)
  • 단순 외부에서 수집한 유가 정보는 활용 가능합니다. 단, Data Leakage 규칙에 유의하여 활용해주세요.
  • Row 내 존재하는 ATA 시점보다 과거의 유가 정보만 활용 가능
  • 법적 제약이 없으며 논문으로 공개된 베이스의 사전 학습 모델(Pre-trained Model) 사용 가능
  • 이전 배포되었던 AI 챌린지 대회 데이터셋으로 학습된 모델을 사전 학습 모델로 사용 시 실격 및 리더보드 삭제

 

5. 예선 코드 제출 규칙

  • 예선 종료 후 본선 진출을 희망하는 팀은 아래의 양식에 맞추어 예선 알고리즘 부문 코드를 dacon@dacon.io 메일로 기한 내에 제출
  • 제출한 코드는 Private Score 복원이 가능해야 함

o  코드에 ‘/data’ 데이터 입/출력 경로 포함

o  코드 파일 확장자: .R, .rmd, .py, .ipynb

o  코드와 주석 인코딩: UTF-8

o  모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)

o  개발 환경(OS) 및 라이브러리 버전 기재

  • 제출 파일 목록

o  Private Score 복원이 가능한 코드 파일

o Private Score 복원이 가능한 모델 weight 파일

o [외부 데이터 사용 시] 외부 데이터 파일

o [학생 팀의 경우] 팀원 전체의 재학증명서 또는 대체인증서류 제출


6. 유의 사항

  • 1일 최대 제출 횟수: 10 회
  • 사용 가능 언어: Python
  • 모든 csv 형식의 데이터와 제출 파일은 UTF-8 인코딩을 적용합니다.
  • [23.10.17 추가] 데이터 수정 배포 이전 데이터셋 활용 시 실격 및 리더보드 삭제
  • [23.10.17 추가] 데이터 수정 배포 이전 데이터셋으로 학습된 모델 활용 시 실격 및 리더보드 삭제
  • 모델 학습과 추론에서 평가 데이터셋 정보 활용(Data Leakage)시 본선 진출 불가능
  • 평가 데이터셋(Test Dataset)의 Row의 개수 혹은 Index (그 밖의 Test Dataset에 대한 정보)를 활용하는 것은 Data Leakage에 해당됩니다.
  • 평가 데이터셋의 2개 이상의 Row로부터 얻는 Rolling 연산 불가능
  • 일반적으로 Test Dataset은 '아예 볼 수 없다' 라고 가정하고 진행해야하며 코드 역시 이를 반영해야합니다.
  • 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
  • 제공한 학습 데이터로부터 모델 학습의 과정이 필수적으로 존재해야함
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 1개를 선택해야 함
  • 데이콘은 부정 제출 행위를 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 아래의 링크를 참고해 주시기 바랍니다.

https://dacon.io/notice/notice/13

 

7. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 토크 게시글 댓글로 질문을 올려 주시기 바랍니다.

예) [DACON 답변 요청] 시상식은 언제 열리나요?


Main Event Schedule

  1. 08.30

    Start Date
  2. 09.30

    Team Merger Deadline
  3. 09.30

    Close