분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
willi19, Private 7위, Private 점수 :0.1337, Linear regression
먼저 잎의 크기가 사진 내의 초록색 픽셀의 개수와 강한 상관관계를 가질 것으로 생각해
open-cv라이브러리를 통해 이미지 내의 green, dark_green, yellow 픽셀의 비율을 추출했습니다.
그 다음 leaf_size를 green, dark_green, yellow에 대한 2차 다항식으로 근사했습니다.
이때 데이터 내의 많은 중복데이터와 이상치들이 있어서 이를 제외하고 선형회귀를 해서 근사식을 얻었습니다.
또한, 다음 날 leaf size의 경우 noise가 너무 심해 현재 leaf size를 기준으로 선형회귀를 했습니다.
test data에 대해서도 마찬가지로 색 별로 차지하는 영역을 구하고 앞서 구한 선형 회귀 식에 대입해서 leaf size를 구했습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved