분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
plot(box, swarm, pair) ML(선형 회귀, Lasso) 최고점 256.93
펭귄 몸무게 분석 코드입니다.
1. Species, Sex, Island, Clutch 중 몸무게 예측에 유의미한 범주(Species, Sex)별로 6개의 집단을 나누어 학습 및 분석했습니다.
2. 성별 예측값은 GaussianNB로 예측하였고, 탄소/질소 결측값은 해당 집단(같은 종 같은 성별)의 평균값으로 체웠습니다.
3. train data의 몸무게가 5g 단위인 것을 확인하고 회귀모델의 예측값을 5g단위로 반올림하는 로직을 추가하였습니다.
4. 기계학습의 경우 LinearRegression, Lasso 회귀가 가장 점수가 잘 나왔습니다.
5. run할 때마다 결과물의 정확도 차이가 발생합니다.
코드 보고 와~ 합니다. 저도 성장하고 싶습니다. 코드 공유 감사합니다~~^^
데이터가 5g단위인거 보고 후처리 하는거는 생각도 못했네요! 잘봤습니다 :D
첫 출전에 최고점이시라니 축하드립니다! 코드 하나하나 읽어보며 저도 분발해야겠네요. 잘 봤습니다!!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
도움 많이되었습니다! 감사합니다.