월간 데이콘 위성 영상을 활용한 북극 해빙 예측 AI 경진대회

알고리즘 | CV | Semantic segmentation | 환경 | MAE & F1

  • moneyIcon 상금 : 100만원
  • 901명 마감

 

[Public 4.0722]Baseline(ConvLSTM)

2021.03.08 11:47 9,740 조회 language

Colab에서 TPU를 사용하여 작성하였습니다.

GPU 사용시 메모리가 부족하니 반드시 TPU를 사용해주시기 바랍니다.

코드
로그인이 필요합니다
0 / 1000
도비콘
2021.03.08 12:41

도비님 감사~

f1930n8
2021.03.09 14:28

x_train과 x_val의 시퀀스가 서로 겹쳐도 대회 실격사유에 문제가 없나요?
[2012, 2013, 2014, 2015, 2016 / 2017]년도 데이터가 x_train에 포함되어있고, [2013, 2014, 2015, 2016, 2017 / 2018]년도 데이터가 x_val에 포함되어 있으면 [2013, 2014, 2015, 2016, 2017]년도 데이터가 훈련/검증용 데이터에 중복으로 들어가게되는데 이 경우 Data Leakage에 해당하는지 궁금합니다.

DACON.Dobby
2021.03.09 14:48

안녕하세요.
본 대회에서 public 문제는 2018년까지의 데이터를 이용하여 2019년을 private은 2019년까지 데이터를 이용하여 2020년을 예측하는 것입니다.
2018년까지 데이터는 학습용으로 제공된 데이터로 학습 또는 검증에 자유롭게 사용 가능합니다.

간지
2023.02.16 16:41

혹시 train_dataset과 val_dataset은 생성하는 이유가 뭔가요?

DACONIO
2023.02.17 10:48

안녕하세요, 간지 님.
val_dataset은 실제로 모델을 활용하기 전에 자신의 모델의 성능을 검증하기 위해 만드는 검증용 데이터셋입니다.
그렇기에 가지고 있는 전체 데이터를 train_dataset과 val_dataset으로 나누는 이유는,
train_dataset으로 학습시킨 모델이 어느정도 성능을 보이는지 val_dataset으로 검증하며, 모델을 개선시키기 위함입니다.
상세한 내용을 위해서, 저희 데이콘의 'Python 튜토리얼'에서 제공드리는 교육자료의 링크를 참고하시기 바랍니다.
https://dacon.io/competitions/open/235698/talkboard/403883?page=1&dtype=recent
감사합니다.