Samsung AI Challenge for Scientific Discovery

Algorithm | NLP | Regression | Properties | MAE

  • moneyIcon Prize : Total 1,400만원
  • 981 Users Completed

 

질문입니다.

Anonymous
2021.08.11 19:56 1,485 Views


안녕하세요.


train.csv랑 dev.csv랑 같이 trainset으로 써도 된다고 이해했는데, 맞나요?

두 파일로 나눠진 이유도 궁금합니다.


감사합니다.


Login Required
0 / 1000
DACONIO
2021.12.21 15:16

안녕하세요. 작성자님

dev.csv도 학습에 사용 가능합니다.
dev.csv의 경우 train.csv와 대부분 동일하나 예측이 어려운 일부의 분자를 샘플링한 상태입니다.

감사합니다.
데이콘 드림

반도체유망주
2021.08.13 00:22

샘플링하셨다는게 대부분의 분자와 다른 유형의 에너지갭을 가진 분자만 따로 추리셨다는 뜻인가용??

DACONIO
2021.12.21 15:17

네 맞습니다.
S1 energy, T1 energy를 확인해보시면 기존 trainset과 분포상의 차이를 확인하실 수 있습니다.

감사합니다.
데이콘 드림