HAICon2020 산업제어시스템 보안위협 탐지 AI 경진대회

알고리즘 | 정형 | 이상탐지 | 제어 | TaPR

상금 : 총 2,000만원
1,254명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

1일 최대 제출 횟수 : 3회

팀 최대 인원 : 5명

1. 데이터

HAI 2.0 학습/검증/평가 데이터셋만 사용해야 합니다.

* 학습 데이터셋: 제어시스템이 정상적으로 운영 중인 상황의 데이터입니다.

* 검증 데이터셋: 제어시스템이 공격을 받아 비정상적인 상황을 포함하는 데이터입니다.

* 평가 데이터셋: 제어시스템이 공격을 받아 비정상적인 상황의 데이터로, 정답(라벨)을 포함하지 않습니다.

2. 학습 및 검증

1) (모델 학습) 학습 데이터셋만을 사용하여 모델을 학습합니다.

2) (모델 검증) 평가도구(TaPR)와 검증 데이터셋으로 모델을 검증합니다.

* 평가도구 'etapr.evalute()' 함수만을 사용하여 평가(코드공유 탭의 baseline 코드 참조)

* 평가도구에 대한 상세 설명은 토론 탭에 있는 "TaPR설명서" 게시물을 참조

3. 제출 및 평가

1) 제출 : 테스트 데이터셋(4개)에 대한 각각의 탐지결과를 sample_submission.csv양식에 맞춰 제출합니다.

* Column 1: time - 시각 (각 테스트 데이터의 시각과 일치해야 함)

* Column 2: attack - 탐지결과 (정상: '0', 비정상: '1')

2) Public Score: 전체 테스트 데이터 중 약 30%로 채점, 대회 기간 중 리더보드에 게시

3) Private Score: 나머지 테스트 데이터로 채점, 대회 종료 직후 공개

* 최종 선택된 탐지결과에 대해서만 평가 진행

3. 참가 방법

개인 또는 팀을 이루어 참여가 가능합니다.
개인: 별도 팀 신청 없이 제출 탭에서 결과를 제출합니다.
팀: 팀 탭에서 등록 후 팀장이 결과를 제출합니다. (상세 내용은 팀 탭에서 팀 병합 정책 확인)

* 동일인이 개인 또는 복수팀에 중복하여 등록이 불가합니다.

4. 유의사항

모델 학습에서 HAI 2.0 검증/평가 데이터셋(또는 그 일부) 사용 시 실격 처리됩니다.

예) 검증 데이터셋 내에 있는 정상 데이터를 일부 샘플링하여 학습에 사용하는 경우 등

모델 검증/평가에서 결과 예측시점보다 미래의 데이터를 사용할 수 없습니다(Data Leakage).

5. 코드 및 설명자료 제출

입상 후보팀(상위 1~10등)에 한해 코드 및 설명자료를 기한 내에 제출해야합니다.
코드 요구사항은 다음과 같습니다.

* 최종 제출 결과물 복원이 가능하며, 실행 가능한 형태(라이브러리 포함)

* 코드 설명 및 사용방법을 포함하는 파일(README.txt) 포함

* 데이터 입출력 경로('./data') 포함

* 코드 파일 확장자: .R, .rmd, .py, .ipynb

* 코드 인코딩: UTF-8

설명자료 요구사항은 다음과 같습니다.

* 제공되는 설명자료 양식(PPT)에 따라 성실히 작성

6. 토론(질문)

해당 대회에서는 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변하지 않을 예정입니다. 결측치 처리 방법, 모델 구성 방법 등 대회 운영 및 데이터 이상 외 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.

대회 주요 일정

07.27
참가신청 오픈
08.17
대회 시작
09.29
팀 병합 마감
09.29
대회 종료
09.30
코드 제출 시작

10.07
코드 제출 마감
10.08
평가 시작
10.13
평가 종료
10.16
결과 공지

개요 규칙 일정 상금 동의사항