분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Public 4.0722]Baseline(ConvLSTM)
Colab에서 TPU를 사용하여 작성하였습니다.
GPU 사용시 메모리가 부족하니 반드시 TPU를 사용해주시기 바랍니다.
x_train과 x_val의 시퀀스가 서로 겹쳐도 대회 실격사유에 문제가 없나요?
[2012, 2013, 2014, 2015, 2016 / 2017]년도 데이터가 x_train에 포함되어있고, [2013, 2014, 2015, 2016, 2017 / 2018]년도 데이터가 x_val에 포함되어 있으면 [2013, 2014, 2015, 2016, 2017]년도 데이터가 훈련/검증용 데이터에 중복으로 들어가게되는데 이 경우 Data Leakage에 해당하는지 궁금합니다.
안녕하세요.
본 대회에서 public 문제는 2018년까지의 데이터를 이용하여 2019년을 private은 2019년까지 데이터를 이용하여 2020년을 예측하는 것입니다.
2018년까지 데이터는 학습용으로 제공된 데이터로 학습 또는 검증에 자유롭게 사용 가능합니다.
혹시 train_dataset과 val_dataset은 생성하는 이유가 뭔가요?
안녕하세요, 간지 님.
val_dataset은 실제로 모델을 활용하기 전에 자신의 모델의 성능을 검증하기 위해 만드는 검증용 데이터셋입니다.
그렇기에 가지고 있는 전체 데이터를 train_dataset과 val_dataset으로 나누는 이유는,
train_dataset으로 학습시킨 모델이 어느정도 성능을 보이는지 val_dataset으로 검증하며, 모델을 개선시키기 위함입니다.
상세한 내용을 위해서, 저희 데이콘의 'Python 튜토리얼'에서 제공드리는 교육자료의 링크를 참고하시기 바랍니다.
https://dacon.io/competitions/open/235698/talkboard/403883?page=1&dtype=recent
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
도비님 감사~