분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Pycaret Classification Tutorial for Intermediate
최근 Pycaret을 활용한 AutoML이 코드공유에서 자주 보여 Binary Classification의 Intermediate 단계 리뷰를 해보았습니다.
(https://github.com/pycaret/pycaret/blob/master/tutorials/Binary%20Classification%20Tutorial%20Level%20Intermediate%20-%20CLF102.ipynb)
초보자 0.7713을 중급자에 적용하니 0.7721로 성능이 늘었습니다.
피쳐를 더욱 다양하게 만들어보고, 인코딩과 정규화, transormer 등 다양하게 활용한다면 더욱 성능이 높아질 것 같습니다.
특히 한 줄로 다양한 Ensemble을 하고, 결과까지 볼 수 있다는 점은 굉장히 매력적인 것 같습니다.
제 경험상 Voting Classifier가 성능이 좋을 때, Stacking이 좋을 때, Stacking 후 Voting이 좋을 때, Ensemble Method없이 결과를 앙상블 할 때 등 여러가지를 테스트해볼게 많았습니다. 하지만 한 줄 코딩으로 이 것들이 검증 가능하면, 사전에 테스트를 Pycaret으로 해서 방향성을 잡는데 도움이 되지 않을까 싶습니다.
물론 이 정도로는 Data Engineer들 사이에서 수상은 어려울 것입니다.
하지만 굉장히 적은 수의 코드만으로도 최소한의 성능을 보장할 수 있기 때문에, 다양한 분야에서 응용이 가능할 것 같아 기대가 됩니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
eda 부터 intermediate까지 커리큘럼 탄탄하네요 ㅎㅎ 감사히 배우겠습니당