연간 데이콘 인공지능 비트 트레이더 경진대회 시즌 2

알고리즘 | 정형 | 회귀 | 금융 | 모의투자

  • moneyIcon Prize : 총 1,200만원
  • 1,213명 마감
Closed

 

----------[시즌1 FAQ] 자주 하는 질문----------

2021.04.01 10:12 1,818 Views

안녕하세요. 데이콘입니다.

시즌1 FAQ 공지드립니다.


Q1) 

Price 관련 데이터(open, high, low 등) 를 보니 코인 인덱스별로 크게 다르지 않고 1을 평균으로 스케일된 값을 가지고 있습니다.

처음에는 코인별로 가격이 상이할거라 생각되었는데 데이터 값을 보니 1분을 기준으로 기존 코인의 1분 평균 값에 대한 비율로 해석하면 되는건가요?

A1)

모든 데이터는 스케일링된 데이터 이며

동일 sample_id의 모든 값들은 x_df의 time이 1379인 open가격으로 나누어져 있습니다.

따라서 x_df.loc[x_df['time']==1379], 'open'] 는 모두 1을 갖습니다. 또한 다른 column의 값들도 마지막 시간의 open가격으로 나누면서 Trades와 같은 경우 정수가 아닌 실수 값을 갖게됩니다. 

 



Q2)

코인별로 각각의 샘플은 시간순서인가요?

A2)

다른 sample_id는 모두 다른 시간의 독립적인 데이터입니다.

 



Q3)

ppt 15~16 설명에 의하면 전의 sample_id의 수익이 다음 sample_id의 초기 자본금으로 연결되던데,

그러면 sample_id와 coin_index가 시간 순으로 연결되는 것을 의미하는 건가요??

A3)

"test 데이터가 N개의 sample_id로 이루워져 있다면 사용자는 연속적으로 독립적인 N번의 투자 기회가 주어지며,

따라서 이전 sample_id의 수익이 다음 sample_id의 초기 자본금으로 연결됩니다."

하지만 sample_id 마다 "데이터"가 연속적으로 연결되어 있지는 않습니다.

(sample_id 1과 sample_id 2는 다른 시간, 다른 코인(coin_index따라)의 데이터 입니다.) 

따라서 동일한 한 sample_id의 y값은 동일한 sample_id의 x값을 통해서 예측해야 합니다.

 

 



Q4)

train set에서 coin_i (i = 0~9) 에 대해 모델 m_i를 만들어 test set에서 coin_i에 적용해도 되나요?

A4)

문제의 접근방식에 대해서는 답변드릴 수 없습니다. 하지만 test set의 coin_4와 train_set의 coin_4는 다른 시간대 동일한 종류의 coin입니다.

 



 

Q5)

각 sample_id마다 모델을 만들어도 되나요? 모델의 개수에 대한 제약이 있는지 궁금합니다.

A5)

네 모델 수에 제한 없습니다.

 


감사합니다.

데이콘 드림