분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Public 1st] 고민할 시간이 없어서 AutoGluon
대회 데이터 셋에 따라 때로는 별로 안 건드리는게 더 좋은 경우도 있는데, 제 경우는 이번 대회가 그러했습니다.
p value 보면서 이런저런 feature 엔지니어링 및 여러 변환을 시도 해 봤는데, 검증 과정에서 유의미한 결과는 얻지 못했습니다.
그닥 의미 있는 코드 공유 내용은 아니라 그냥 운이 좋았던 거 같습니다.
테스트해 본 여러 모델이랑 AutoML 툴 중 AutoGluon이 점수가 가장 높았습니다.
AutoGluon의 자세한 내용은 해당 라이브러리의 페이지를 참고 해 주시기 바랍니다.
AutoGluon Document : https://auto.gluon.ai/stable/index.html
삭제된 댓글입니다
이제부터 seed는 69... 메모...
stack option, seed 차이로 0.2 이상이 나는군요! 잘 배워 갑니다.
autoML과 환상의 기도메타 대전..!
이번 데이터 셋은 더 그런거 같네요.
그냥 운이 좋았단 말 밖에 할 말이 없습니다.
혹시 새로운 feature를 만드는 feature engineering이나 standardscaling, oitlier 제거 혹은 누름, oversampling 등의 preprocessing을 하지 않는 것이 더 성능이 좋았나요?
정확히 말씀드리면, 여러 모델과 AutoML 툴에서 말씀해주신 여러 방법을 시도했을 때, 성능이 조금씩 오르는 것을 확인했으나, 기본 데이터로 돌린 AutoGluon 보다 성능이 좋지 않았습니다.
mljar에선 feature engineering도 포함되어 있는걸 봤는데 autogluon은 어떤지 모르겠네요!
random seed 고정해줘서 코드 돌릴 때마다 당연히 같은 결과 값이 나오겠죠??
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
seed에 유의미한 결과값이..1등을