분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
월간 데이콘 생체 광학 데이터 분석 AI 경진대회
scikit-learn의 MultiOutputRegressor 사용유무 차이
안녕하세요, 제가 몰랐던 부분을 알게 돼 공유하고자 글을 올립니다.
대회의 Baseline과 최정명님의 코드에서는 modeling 과정에서 scikit-learn의 MultiOutputRegressor을 사용하지 않은(multi target을 단일 target으로 각각 접근해서 예측) 방법인 반면, Jamm님의 코드에서는 MultiOutputRegressor를 사용한(multi target을 multi target 그대로 예측) 방법으로 서로 달라서 두 가지 방법을 어떤 관점으로 봐야할 지 궁금했었는데요, 알아본 결과 두 가지 방법의 결과는 같다고 합니다.
하지만 전자의 방법은 각각의 target에 대해 전처리나 FE를 따로 할 수 있다는 장점이 있어서 예측 성능이 더 좋게 나올 수 있다고 하네요.
몰랐던 분들께 많은 도움이 됐으면 좋겠습니다!
참고) scikit-learn의 MultiOutputRegressor 공식 문서: https://scikit-learn.org/stable/modules/generated/sklearn.multioutput.MultiOutputRegressor.html
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
nevret 님 좋은 팁 감사합니다.
모두에게 도움이 될것 같습니다.