HD현대 AI Challenge

알고리즘 | 채용 | 정형 | 조선해양 | 회귀 | MAE

  • moneyIcon 상금 : 2,000만 원
  • 1,509명 마감

 

데이터 명세 및 도메인 용어 설명 (23.10.18 수정)

2023.09.22 15:21 5,061 조회

안녕하세요 HD현대 AI Challenge 참가자 여러분.


데이터 Column별 세부 설명 및 도메인 용어 설명은 아래의 링크에서 확인 하실 수 있습니다.

  • data_info.xlsx : [링크]
  • 23.09.27 09:39 : 일부 컬럼 단위 정보 추가 제공
  • 23.10.17 17:20 : Short-cut 컬럼 정보 삭제
  • 23.10.17 18:14 : Short-cut 컬럼 정보 ('BDI_ADJ') 삭제
  • 23.10.18 12:41 : 기상 정보의 수집 과정은 'ATA 시점에서의 예보데이터' 추가


데이터 혹은 도메인 관련 질문 사항은 본 게시글의 댓글로 부탁드립니다.

감사합니다.

데이콘 드림

로그인이 필요합니다
0 / 1000
탈모르메이커
2023.09.27 13:18

ARI_CO및 ARI_PO는 정보보호를위한 임의로 생성한 데이터인가요? 아니면 모든데이터는 실제 데이터인가요?
데이터셋에 있는 ARI_CO-ARI_PO 코드가 실제 항구코드가 아닌것같아서 질문드립니다. 

DACON.GM
2023.09.27 13:24

안녕하세요 talmormaker님,
해당 컬럼의 데이터는 실제 데이터를 기반으로 비식별화 처리된 데이터입니다.
감사합니다.

hi_sj_99
2023.09.30 19:20

안녕하세요! 데이터에 BUILT변수는 선박의 연령을 나타내는데 각 선박에 대해 ATA가 변화했는데도 값이 모두 같은 거 같습니다. 
제외하고 분석 및 모델링 진행해도 될까요? 혹은 사용해야 한다면 데이터 수정해서 업로드 해주실 수 있는지 문의 드립니다.

DACON.GM
2023.09.30 21:17

안녕하세요 hi_sj_99님,
제공드린 변수를 모두 활용해야할 필요는 없습니다.
분석, 인사이트 도출 또는 모델 학습에 유용하지 않다고 판단된다면 제거하여 진행하여도 문제 없습니다.
감사합니다.

비회원
2023.10.02 21:14

삭제된 댓글입니다

tree.jhk
2023.10.07 00:56

U_WIND, V_WIND 각각이 풍향의 u벡터 v벡터라는데, 어떤 시점에서 측정한 풍속인가요?

DACON.GM
2023.10.18 13:19

[수정] 정박 시점에 해당 선박의 위치로부터 가장 가까운 관측소의 (+예보) 정보입니다.

hhha
2023.10.13 10:12

PORT_SIZE 접안지 폴리곤 영역의 크기는 무엇을 의미한가요? 폴리곤이 어떻게 정의하고 지정을 한것인가요?

DACON.GM
2023.10.13 10:32

해당 내용은 정보 공개 범위에 대한 문제가 있을 수 있으므로 주최측의 답변을 받는 대로 전달드리겠습니다.

DACON.GM
2023.10.13 11:12

주최측의 답변입니다.
A. 해당 폴리곤 영역은 도메인 전문가들이 직접 영역을 표시한 영역입니다. 폴리곤은 접안되었다고 판단된 선박들을 군집하여 사람(도메인 전문가)이 직접 해당영역을 표시하였습니다.

hhha
2023.10.13 11:16

이게 항구에 대한 영역이 아니라 항구에 도착 당시에 항구에 접안되어 있다고 생각된 선박들의 면적이라고 생각하면 될까요???
만약에 이것이 맞다고 하면 정박하지 않고 바로 접안 한 경우 해당 선박에 대한 면적이 포함되는지도 궁금합니다

hhha
2023.10.13 10:29

대기 시간이라는 것이 정박지에서 출발하여 접안지에 도착할때 까지의 시간인가요 아니면 정박지에서 정박 후 다시 출발 할때까지의 시간인가요?

DACON.GM
2023.10.13 10:31

해당 내용은 대회 개요 부분에 정의되어있습니다.
"본 대회에서는 접안(배를 육지에 대는 것;Berthing) 전에 선박이 해상에 정박(해상에 닻을 바다 밑바닥에 내려놓고 운항을 멈추는 것;Anchorage)하는 시간을 대기시간으로 정의"

chorysmind
2023.10.14 07:31

도메인 지식
1) ATA 기준은 한국시간으로 기준을 잡은 건가요?
2) ATA_LT는 정박을 시작한 시간을 도착항의 소속국가 시간 기준으로 잡은 건가요?
- ATA하고 ATA_LT와의 개념이 헷갈립니다.

HD현대-AIC
2023.10.17 11:01

1) ATA는 UTC를 기준으로 수집된 값입니다.
2) LT는 Local Time을 의미하는 약어로 소속국가 시간대를 기준으로 표기한 값이 맞습니다.

상준.
2023.10.17 18:32

외부데이터의 사용여부는 그럼 어떻게 되는걸까요?

DACON.GM
2023.10.17 18:47

안녕하세요 상준님,
외부데이터는 사용 가능합니다.
유가 정보의 외부 데이터 역시 사용 가능하나, Row에 존재하는 ATA 시점보다 과거의 유가 정보 데이터만을 활용할 수 있습니다.
ATA 시점 이후의 유가 정보를 외부데이터로 활용한다면 Data Leakage에 해당합니다. (미래의 정보를 활용하는 것이므로)
아울러, AI 챌린지 내 이전 배포되었던 데이터를 외부 데이터로 사용하는 것은 불가능합니다.
감사합니다.

상준.
2023.10.19 05:58

삭제된 댓글입니다

INTLAB_채운
2023.10.27 02:59

ARI_PO 풀네임이나 위치(도시)를 알 수 있을까요?

DACON.GM
2023.10.27 08:54

ARI_PO의 경우, 비식별화 목적으로 처리된 컬럼이기 때문에 제공이 불가능합니다.