농업 환경 변화에 따른 작물 병해 진단 AI 경진대회

농업 환경 변화에 따른 작물 병해 진단 AI 경진대회 수상자 인터뷰_지톨

2022.03.22 15:23 2,118 Views

농업 환경 변화에 따른 작물 병해 진단 AI 경진대회

🎉 Team  지톨 님, 수상을 진심으로 축하합니다. 🎉


🏆 강지철 님 ((주)비트나인)


🎙세 우승팀 중 한 팀이 되었는데요, 수상을 진심으로 축하드립니다. 수상 소감 부탁드립니다.

강지철

학교에서 연구만 하다가 대회는 첫 참가인데 수상을 하게 되어 기분도 좋으면서, 얼떨떨한 기분입니다. 제가 1, 2위 수상자분과 다르게 모델 성능으로는 최상위 score를 내지는 못했는데, 모델 성능 score 외에도 다른 부분들을 좋게 봐주셔서 수상할 수 있었던 것 같습니다. 대회 참여하면서, 연구와는 또 다른 competition의 재미를 느낄 수 있었습니다. Baseline 코드와 각종 정보 공유해주신 참가자분들, 대회 참여에 도움 준 서울과학기술대학교 데이터사이언스학과 학생들, 그리고 대회 주최 및 주관해주신 LG와 데이콘 측에 감사드립니다. 앞으로도 좋은 대회가 있으면 종종 참가해보고 싶습니다.


🎙이번 대회에서 특별하게 활용한 데이터 전처리 방법이 있었을까요?

강지철

환경 데이터의 경우 식물 종별로 병해가 발생하는 온도나 습도가 다를 것이라고 판단하여 모든 데이터를 변화량으로 바꾸어 사용했습니다. 그리고, 이상치의 영향을 줄이기 위해 robust scaling 기법을 사용했으며 결측치를 해당 데이터의 중앙값으로 대체했습니다. 이미지의 경우 크기를 가로 512px, 세로 512px로 조정하여 사용했으며 이미지 형식은 normalization 시 오히려 성능이 하락하여 0과 255사이의 integer 형식을 사용했습니다. 


🎙대회 문제를 풀어가기 위해 활용한 데이터 증강 및 모델링 방법에 대해 말해주세요.

강지철

이미지 증강은 먼저 회전, affine 변환, 밝기나 색 변환과 같은 잘 알려진 증강 기법을 대부분 활용했습니다. 이미지 증강 라이브러리를 종류도 여러 가지로 사용하기도 했습니다. 그리고 edge detection 함수를 사용해 병해 부위의 디테일을 강조한 후 원래 이미지와 합치는 방식으로 증강을 해보았으며, bounding box 내부 또는 외부에만 증강 기법을 적용하는 식으로도 증강 기법을 적용해보았습니다. 이미지 모델은 tinynet_a를, 환경 데이터에는 LSTM 모델을 사용했습니다. 학습 시 과적합을 피하기 위해 label smoothing 값을 극단적으로 높게 주었고, 학습 epoch 수와 learning rate를 낮게 설정하는 전략을 사용했습니다.


🎙위의 기술적인 요소들을 활용하기 위해 참고한 논문, 경험 같은 것들이 있을까요?

강지철

제가 학교나 회사에서 수행하는 주 연구 주제는 그래프 딥러닝 모델인데, 이 대회의 주제와 분야는 다르지만 딥러닝 모델의 성능을 향상시키기 위해 다양한 실험을 해본 경험이 도움이 된 것 같습니다. 또한, 논문보다는 주로 블로그나 깃허브에서 이미지 증강 코드를 참고했습니다.


🎙대회를 진행하면서 직면했던 문제점과 이를 해결하기 위해 어떠한 방법을 활용하셨나요?

강지철

훈련셋이 평가셋에 비해 현저히 적어, 이미지 증강 기법을 최대한 다양하게 적용했고 과적합을 피할 수 있도록 모델링 방향을 설정했습니다. 데이터 불균형이 심하여 일부 레이블에 oversampling을 수행하기도 했습니다.


🎙대회 진행과 관련하여 개선해야 할 점에 대해 말해주세요

강지철

대회 형식에 특별히 불만은 없지만, 설 연휴 기간이 대회 기간 후반부와 겹쳐 힘들었던 기억이 있습니다. 대회 기간 설정에 있어 이러한 부분이 고려가 되면 좋을 것 같습니다.