생육 환경 최적화 경진대회

🌿생육 환경 최적화 경진대회 알고리즘 부문 수상자 인터뷰 _ skmoon07

2022.09.21 09:44 1,218 조회

생육 환경 최적화 경진대회 분석

🎉 Team skmoon07 님, 수상을 진심으로 축하합니다. 🎉


🏆 문승기 님 (LS Electric 인턴, 통계학 학사)


🎙우승팀 중 한 팀이 되었는데요, 수상을 진심으로 축하드립니다. 수상 소감 부탁드립니다.

🏅안녕하세요 문승기입니다. 경진대회를 마련해 주신 모든 관계자분께 진심으로 감사의 말씀을 드립니다. 첫 경진대회이다 보니 여러 부분에 서툴렀지만 최종 2등을 하게 되어 매우 기쁩니다. 대회 기간 저를 응원해주신 분들께 큰 감사를 전달해 드리고 싶으며 앞으로도 더욱 성장할 수 있도록 온갖 노력을 하겠습니다.


🎙모델 스코어를 가장 많이 올릴 수 있었던 방법(혹은 실험)에 대해 말해주세요.

🏅앙상블은 과적합 (overfitting) 감소 효과가 있으며, 개별 모델 성능이 잘 안 나올 때 앙상블 학습을 이용하면 성능이 향상될 수 있습니다. 별도로 모델 (CNN, Catboost, ANN) 학습한 후 예측 점수가 더 좋을수록 모델에 가중치를 높게 적용하여 최종적으로 3개의 모델을 결합하는 앙상블 방식으로 택했습니다.


🎙환경 데이터가 문제를 해결하는 것에 있어서 도움이 되었나요? 도움이 되지 않았다면 어떤 이유 때문이었을까요?

🏅저는 마스킹 된 청경채 이미지를 픽셀값 추출하면서 환경 데이터 Feature 변수로 포함했습니다. 산점도 플롯 이용해서 무게, 픽셀 비율 상관관계 살펴보았더니 무게와 상당히 유사한 결과를 확인할 수 있었습니다. 오직 순 환경 데이터만 이용하면 모델이 제대로 학습되지 않아 추가 변수 고려할 필요가 있었습니다.


🎙대회 기간 동안 모델 성능을 자체적으로 평가한 자신만의 밥법이 있을까요?

🏅CNN은 이미지를 인식하기 위해 비슷한 패턴과 색깔을 찾는 데 특히 유용하지만 각 청경채 사진을 살펴보면 밝기가 서로 다르다고 볼 수가 있습니다. OpenCV에 cv2.convertScaleAbs() 이용해 모든 청경채 이미지 밝기 자동으로 조절하여 일치할 수 있게끔 보정하는 작업을 하면서 여러 임계값을 설정해 좀 더 자체적으로 성능을 평가할 수 있었습니다.


skmoon07 팀 2등 알고리즘 코드 공유 보러가기