분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Private 16등 - mljar supervised AutoML + 변수 추가
mljar-supervised AutoML과 AutoGloun 두 가지 라이브러리를 데이터를 조금 건드린 후 사용해 보니, AutoML이 더 좋은 성능을 보였기에 변수(기존 데이터 가공)를 추가해 보았습니다.
여러 가지를 시도해 본 결과, 왜도와 상관관계 계수와 상관없이 변수를 첨가할 때마다 모델의 성능이 개선되었고,
LPG, CNG, 하이브리드를 묶은 하나의 변수로 수정했을 때 조금 더 향상된 성능을 냈으며,
5시간 학습 이후부터는 과적합되는 경향을 보였고,
결과를 소수점 둘째 자리까지 반올림하였을 때 미세하게 더 좋은 점수를 얻을 수 있었습니다.
종종 데이터를 건드리지 않았을 때 좋은 결과를 얻는 대회가 있는 듯해요.
아무튼, 지나친 데이터 생성이 오히려 안한 것보다 못할 때가 있다는 것을 다시 끔 깨달았네요.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved