생육 환경 최적화 경진대회

알고리즘 | CV | 회귀 | 생육 | NMAE

  • moneyIcon 상금 : 총 300만원
  • 762명 마감

 

FarmInSun, Private 1위, Private 점수 : 0.12773, Polynomial Regr

공동작성자

stroke
2022.05.25 12:28 2,615 조회 language

**제목이 잘린것을 늦게확인했네요. Polynomial Regression(다항회귀) 이용했습니다.
안녕하세요. Private 1위팀 FarmInSun입니다.
저희팀은 머신러닝, 딥러닝을 둘다 이용해봤지만 메타데이터를 쓸경우, xgboost, lightgbm을 통한 방법이 0.1534로 가장 좋았고 메타데이터를 쓰지 않고 이미지만 사용했을경우 0.1316으로 public 4위,0.12773 private1위를 기록했네요. 
첫대회이고 머신러닝,딥러닝을 2주배우고 시작한 대회라 많이 미흡해 메타데이터로는 제대로 점수를 낼수가 없었습니다. 오히려 메타데이터를 이용하면 점수가 더 떨어지니 메타데이터를 활용해 좋은점수를 내신 다른분들의 코드가 궁금해 죽을지경입니다 ㅜㅜ 
처음에 올라온  baseline에서 epochs, learning_rate, batch_size 수정시, 0.1523이 나왔었는데 이때부터 메타데이터보단 이미지만 이용하는게 더 좋은결과가 나올거라고 생각하긴 했습니다.

레이블인 다음날 leaf-size의 noise가 심해 현재 leaf-size와 다음날 leaf-size로 진행해봤는데 현재 사이즈로 했을때 훨씬 더 점수가 잘나왔습니다. 실제로 다음날 leaf-size를 기준으로 다항회귀 진행시 0.2134로 현저히 떨어지는 점수가 나왔습니다. 이상치 이미지를 좀더 잘 걸러냈더라면 더 좋은 결과가 나왔을듯 하네요.

open-cv 라이브러리를 통해, 이미지를 hsv로 변환 후, 색영역을 조절해 가장 낮은 mae가 나오는 색영역 파라미터를 구하고, case58과 중복이 되는 이미지인 case59와 색영역상 제대로 마스킹이 되지않는 case23을 고려해 3개의 다항 Linear regression모델을 비교해 가장 좋은 mae가 나온 모델로 testdata에 대해 예측값을 구했습니다.

코드