상추의 생육 환경 생성 AI 경진대회

알고리즘 | 정형 | 생육 | 회귀 | 생성 | RMSE | 정성평가

  • moneyIcon 상금 : 300만 원
  • 859명 마감

 

[예측 모델 Baseline] Simple LSTM

2022.11.21 09:16 4,693 조회 language

안녕하세요. 데이콘입니다.

데이콘 베이스라인은 모든 참가자의 '제출'을 목표로 합니다. 
해당 내용에 관한 질문은 [토크] 게시판에 게시해 주세요.

아래 베이스라인은 1시간 간격의 환경데이터에서 1일의 히스토리를 추출하여 각 Target(predicted_weight_g)에 매칭하여 학습한 결과입니다.
이번 대회의 제출 양식은 각 CASE별 예측된 일별 잎 중량을 담은 csv파일들을 zip 형식으로 압축하여 제출하는 것으로,
보통의 대회의 제출 방식과 다소 차이가 있으므로 제출 방식 관련하여 베이스라인 코드를 꼭 참조해주시기 바랍니다.

본 베이스라인은 '예측 모델'에 대한 베이스라인이며,
'생성 모델'은 '예측 모델'을 활용하여 자유롭게 구성하실 수 있습니다.
본 대회는 '예측 모델' 정량 평가 30% + '생성 모델' 정성 평가 70%으로 평가 항목을 꼭 확인 부탁드립니다.

감사합니다. 
데이콘 드림

코드
로그인이 필요합니다
0 / 1000
Arteddy
2023.03.14 10:54

안녕하세요, 코드보고 열심히 공부하고있는 학생입니다!
우선 참고하기 좋은 코드 감사합니다.
다름이 아니라 criterion 관련 질문있어서 댓글남깁니다. 평가산식은 RMSE인데 loss function은 L1 Loss로 정의돼있는 이유가 궁금합니다.
이상치에 덜 민감하게 반응하기 위해서일까요~?
만약 그렇다면 loss function은 L1Loss로 정의하고 Metric은 따로 모니터링하지 않은 이유가 궁금합니다!
답변 미리 감사합니다!!

DACON.GM
2023.03.14 12:56

안녕하세요 Arteddy님,
먼저 베이스라인 코드는 참가자들의 제출을 돕기 위한 코드로 최소한의 구성으로만 작성된 코드입니다.
질문에 대한 답변을 드립니다.
1. 평가 Metric과 Loss Function을 일치시켜 학습시키는 전략은 종종 유효하기도 하나, 항상 유효한 방법은 아닙니다.
대체로 회귀 문제에서 Loss Function은 L1, L2 Loss를 많이 사용하고 각각에 대한 특성이 있기 때문에, 가설을 설정하고 실험을 통해 결과를 지켜보는 것이 바람직합니다. 물론 L1, L2 이외에도 charbonnier loss, smooth l1 loss 등등 많이 존재하기 때문에 살펴보시는 것을 추천합니다.
결과적으로 이 베이스라인 코드에서 L1 Loss를 사용한 이유는 특별한 가설 없이 회귀 문제에서 대표적인 Loss Function을 적용을 보여주었다 정도로 이해 부탁드립니다.
2. Validation Metric 을 모니터링하지 않은 이유는 서론에 말씀드렸듯이 본 코드는 최소한의 구성만을 담은 코드로 제공되었기 때문입니다. 또한 100% 일치하는 가정은 아니지만 차이를 기반으로 하는 L1과 RMSE는 어느정도 비례할 것이라는 가정하에 Metric 모니터링 코드는 제외하였습니다.
감사합니다.

Arteddy
2023.03.14 16:06

자세한 답변 정말 감사드립니다!!
행복한 하루 되세요~

이전 글
초안
대회 - 상추의 생육 환경 생성 AI 경진대회
좋아요 6
조회 1,973
댓글 0
일 년 전
현재 글
[예측 모델 Baseline] Simple LSTM
대회 - 상추의 생육 환경 생성 AI 경진대회
좋아요 10
조회 4,693
댓글 3
일 년 전
다음 글
다음 글이 존재하지 않습니다.