Samsung AI Challenge for Scientific Discovery

알고리즘 | NLP | 회귀 | 물성 | MAE

  • moneyIcon 상금 : 총 1,400만원
  • 981명 마감

 

질문입니다.

작성자 비공개
2021.08.11 19:56 1,484 조회


안녕하세요.


train.csv랑 dev.csv랑 같이 trainset으로 써도 된다고 이해했는데, 맞나요?

두 파일로 나눠진 이유도 궁금합니다.


감사합니다.


로그인이 필요합니다
0 / 1000
DACONIO
2021.12.21 15:16

안녕하세요. 작성자님

dev.csv도 학습에 사용 가능합니다.
dev.csv의 경우 train.csv와 대부분 동일하나 예측이 어려운 일부의 분자를 샘플링한 상태입니다.

감사합니다.
데이콘 드림

반도체유망주
2021.08.13 00:22

샘플링하셨다는게 대부분의 분자와 다른 유형의 에너지갭을 가진 분자만 따로 추리셨다는 뜻인가용??

DACONIO
2021.12.21 15:17

네 맞습니다.
S1 energy, T1 energy를 확인해보시면 기존 trainset과 분포상의 차이를 확인하실 수 있습니다.

감사합니다.
데이콘 드림