HAICon2020 산업제어시스템 보안위협 탐지 AI 경진대회

알고리즘 | 정형 | 이상탐지 | 제어 | TaPR

  • moneyIcon 상금 : 총 2,000만원
  • 1,254명 마감

1일 최대 제출 횟수 : 3회

팀 최대 인원 : 5명


1. 데이터

  • HAI 2.0 학습/검증/평가 데이터셋만 사용해야 합니다.

* 학습 데이터셋: 제어시스템이 정상적으로 운영 중인 상황의 데이터입니다.

* 검증 데이터셋: 제어시스템이 공격을 받아 비정상적인 상황을 포함하는 데이터입니다.

* 평가 데이터셋: 제어시스템이 공격을 받아 비정상적인 상황의 데이터로, 정답(라벨)을 포함하지 않습니다.


2. 학습 및 검증

1) (모델 학습) 학습 데이터셋만을 사용하여 모델을 학습합니다.

2) (모델 검증) 평가도구(TaPR)와 검증 데이터셋으로 모델을 검증합니다.

* 평가도구 'etapr.evalute()' 함수만을 사용하여 평가(코드공유 탭의 baseline 코드 참조)

* 평가도구에 대한 상세 설명은 토론 탭에 있는 "TaPR설명서" 게시물을 참조


3. 제출 및 평가

1) 제출 : 테스트 데이터셋(4개)에 대한 각각의 탐지결과를 sample_submission.csv양식에 맞춰 제출합니다.

  * Column 1: time - 시각 (각 테스트 데이터의 시각과 일치해야 함)

* Column 2: attack - 탐지결과 (정상: '0', 비정상: '1')

2) Public Score: 전체 테스트 데이터 중 약 30%로 채점, 대회 기간 중 리더보드에 게시

3) Private Score: 나머지 테스트 데이터로 채점, 대회 종료 직후 공개

* 최종 선택된 탐지결과에 대해서만 평가 진행


3. 참가 방법

  • 개인 또는 팀을 이루어 참여가 가능합니다.
  • 개인: 별도 팀 신청 없이 제출 탭에서 결과를 제출합니다.
  • 팀: 팀 탭에서 등록 후 팀장이 결과를 제출합니다. (상세 내용은 팀 탭에서 팀 병합 정책 확인)

* 동일인이 개인 또는 복수팀에 중복하여 등록이 불가합니다.


4. 유의사항

  • 모델 학습에서 HAI 2.0 검증/평가 데이터셋(또는 그 일부) 사용 시 실격 처리됩니다.

예) 검증 데이터셋 내에 있는 정상 데이터를 일부 샘플링하여 학습에 사용하는 경우 등

  • 모델 검증/평가에서 결과 예측시점보다 미래의 데이터를 사용할 수 없습니다(Data Leakage).


5. 코드 및 설명자료 제출

  • 입상 후보팀(상위 1~10등)에 한해 코드 및 설명자료를 기한 내에 제출해야합니다.
  • 코드 요구사항은 다음과 같습니다.

* 최종 제출 결과물 복원이 가능하며, 실행 가능한 형태(라이브러리 포함)

* 코드 설명 및 사용방법을 포함하는 파일(README.txt) 포함

* 데이터 입출력 경로('./data') 포함

* 코드 파일 확장자: .R, .rmd, .py, .ipynb  

* 코드 인코딩: UTF-8

  • 설명자료 요구사항은 다음과 같습니다.

* 제공되는 설명자료 양식(PPT)에 따라 성실히 작성


6. 토론(질문)

  • 해당 대회에서는 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변하지 않을 예정입니다. 결측치 처리 방법, 모델 구성 방법 등 대회 운영 및 데이터 이상 외 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.

대회 주요 일정

  1. 07.27

    참가신청 오픈

  2. 08.17

    대회 시작

  3. 09.29

    팀 병합 마감

  4. 09.29

    대회 종료

  5. 09.30

    코드 제출 시작

  1. 10.07

    코드 제출 마감

  2. 10.08

    평가 시작

  3. 10.13

    평가 종료

  4. 10.16

    결과 공지

1일 최대 제출 횟수 : 3회

팀 최대 인원 : 5명


1. 데이터

  • HAI 2.0 학습/검증/평가 데이터셋만 사용해야 합니다.

* 학습 데이터셋: 제어시스템이 정상적으로 운영 중인 상황의 데이터입니다.

* 검증 데이터셋: 제어시스템이 공격을 받아 비정상적인 상황을 포함하는 데이터입니다.

* 평가 데이터셋: 제어시스템이 공격을 받아 비정상적인 상황의 데이터로, 정답(라벨)을 포함하지 않습니다.


2. 학습 및 검증

1) (모델 학습) 학습 데이터셋만을 사용하여 모델을 학습합니다.

2) (모델 검증) 평가도구(TaPR)와 검증 데이터셋으로 모델을 검증합니다.

* 평가도구 'etapr.evalute()' 함수만을 사용하여 평가(코드공유 탭의 baseline 코드 참조)

* 평가도구에 대한 상세 설명은 토론 탭에 있는 "TaPR설명서" 게시물을 참조


3. 제출 및 평가

1) 제출 : 테스트 데이터셋(4개)에 대한 각각의 탐지결과를 sample_submission.csv양식에 맞춰 제출합니다.

  * Column 1: time - 시각 (각 테스트 데이터의 시각과 일치해야 함)

* Column 2: attack - 탐지결과 (정상: '0', 비정상: '1')

2) Public Score: 전체 테스트 데이터 중 약 30%로 채점, 대회 기간 중 리더보드에 게시

3) Private Score: 나머지 테스트 데이터로 채점, 대회 종료 직후 공개

* 최종 선택된 탐지결과에 대해서만 평가 진행


3. 참가 방법

  • 개인 또는 팀을 이루어 참여가 가능합니다.
  • 개인: 별도 팀 신청 없이 제출 탭에서 결과를 제출합니다.
  • 팀: 팀 탭에서 등록 후 팀장이 결과를 제출합니다. (상세 내용은 팀 탭에서 팀 병합 정책 확인)

* 동일인이 개인 또는 복수팀에 중복하여 등록이 불가합니다.


4. 유의사항

  • 모델 학습에서 HAI 2.0 검증/평가 데이터셋(또는 그 일부) 사용 시 실격 처리됩니다.

예) 검증 데이터셋 내에 있는 정상 데이터를 일부 샘플링하여 학습에 사용하는 경우 등

  • 모델 검증/평가에서 결과 예측시점보다 미래의 데이터를 사용할 수 없습니다(Data Leakage).


5. 코드 및 설명자료 제출

  • 입상 후보팀(상위 1~10등)에 한해 코드 및 설명자료를 기한 내에 제출해야합니다.
  • 코드 요구사항은 다음과 같습니다.

* 최종 제출 결과물 복원이 가능하며, 실행 가능한 형태(라이브러리 포함)

* 코드 설명 및 사용방법을 포함하는 파일(README.txt) 포함

* 데이터 입출력 경로('./data') 포함

* 코드 파일 확장자: .R, .rmd, .py, .ipynb  

* 코드 인코딩: UTF-8

  • 설명자료 요구사항은 다음과 같습니다.

* 제공되는 설명자료 양식(PPT)에 따라 성실히 작성


6. 토론(질문)

  • 해당 대회에서는 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변하지 않을 예정입니다. 결측치 처리 방법, 모델 구성 방법 등 대회 운영 및 데이터 이상 외 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.

대회 주요 일정

  1. 07.27

    참가신청 오픈
  2. 08.17

    대회 시작
  3. 09.29

    팀 병합 마감
  4. 09.29

    대회 종료
  5. 09.30

    코드 제출 시작
  6. 10.07

    코드 제출 마감
  7. 10.08

    평가 시작
  8. 10.13

    평가 종료
  9. 10.16

    결과 공지