분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
plot(box, swarm, pair) ML(선형 회귀, Lasso) 최고점 256.93
펭귄 몸무게 분석 코드입니다.
1. Species, Sex, Island, Clutch 중 몸무게 예측에 유의미한 범주(Species, Sex)별로 6개의 집단을 나누어 학습 및 분석했습니다.
2. 성별 예측값은 GaussianNB로 예측하였고, 탄소/질소 결측값은 해당 집단(같은 종 같은 성별)의 평균값으로 체웠습니다.
3. train data의 몸무게가 5g 단위인 것을 확인하고 회귀모델의 예측값을 5g단위로 반올림하는 로직을 추가하였습니다.
4. 기계학습의 경우 LinearRegression, Lasso 회귀가 가장 점수가 잘 나왔습니다.
5. run할 때마다 결과물의 정확도 차이가 발생합니다.
코드 보고 와~ 합니다. 저도 성장하고 싶습니다. 코드 공유 감사합니다~~^^
데이터가 5g단위인거 보고 후처리 하는거는 생각도 못했네요! 잘봤습니다 :D
첫 출전에 최고점이시라니 축하드립니다! 코드 하나하나 읽어보며 저도 분발해야겠네요. 잘 봤습니다!!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
도움 많이되었습니다! 감사합니다.