분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
팀명_ARIMA카나
데이터 설명
https://drive.google.com/file/d/1KjXnicqz1UavlmbjBfukNTR3jSeE1A-e/view?usp=sharing
Naver Finance의 주가 데이터를 기반으로 둔 FinanceDataReader을 활용하여
2023년 1월 1일부터 2023년 7월 28일까지의 OHLCV 데이터를 추출한 csv 파일입니다.
리더보드에서 높은 순위라 궁금하던차에 알고리즘이 단순하여 colab에서 직접 돌려보았습니다.
제가 볼때 3가지 정도 이슈룰 발견했네요. ( 저는 dacon 관계자가 아니고, 개인적인 관심으로...)
1. 코드상에서는 파일두개를 읽어들이는데, 첨부링크의 파일명과 다릅니다. 변경해야 돌아가더군요.
2. train_close = test[test['Code'] == code][['Close','Change']] 부분에서 test가 정의되지 않았다고 오류가 발생해서, 전체 완료가 안됩니다.
3. 50일간의 기준을 뽑는 방식이 5/31~6/21일의 데이터를 기준으로 선정하고 있어, "예견 편향성"으로 판단될 수 있습니다.
안녕하세요. 우선 저희 결과물에 관심 가져주셔서 감사합니다! 말씀해주신 3가지 이슈에 대해 답변을 드리자면,
1. 코드상 파일명에 맞게 드라이브에 업로드된 파일명을 변경했습니다.
2. train_close = test[test['Code'] == code][['Close','Change']] 를 train_close = private[private['Code'] == code][['Close','Change']]와 같이 수정해서 실행해보시면 잘 작동할 겁니다.
3. 해당 코드가 작성된 시점은 private 기간입니다. 즉, public 기간 동안은 예견 편향성에 해당한다고 말씀해 주신 5/31 ~ 6/21일의 데이터를 사용하지 않았습니다. private에 사용 가능한 데이터의 기간은 7/28일 까지로, 5/31 ~ 6/21일의 데이터를 기준으로 window size를 선정한 것은 예견편향성에 해당되지 않는다고 판단했습니다.
추후 저희 코드와 관련된 문제점이나 궁금증에 대해서 질문해 주신다면 언제든지 답변 해드리겠습니다!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Deleted Comment