분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
건설기계 오일 상태 분류 AI 경진대회
혹시 머신러닝으로 이 대회를 준비하시는 분 계시나요?
코드 공유 된 것이나 2차 평가 방식을 보면
딥러닝으로 해결해야 하는 것 같은데요...
저는 머신러닝으로 해결해보려고 시도중입니다.
혹시 머신러닝으로 도전중이신 분 있으시면 댓글 남겨주십시오... ㅠㅠ
좋은 조언 감사합니다! 오늘 시간내서 꼭 한 번 해볼게요... 혼자 구글링 하면서 헤매고 있었는데 이렇게 글을 올리니 역시 도와주시는 분들이 계시네요... 감사합니다!@
삭제된 댓글입니다
머신러닝으로 못하는 것은 아닙니다 부스팅 트리 계열에선 predict_proba라는 확률값을 리턴해주는 함수가 있는데 이를 이용해서 student 모델에서 활용하시면 됩니다.
어떤 분이 knowledge distillation 전략을 머신러닝으로 할 수 있는 방법을 이야기 해주셨던데 같은 이야기이신 것 같아요...
1. train 데이터 전체 columns 으로 predict_proba로 확률값을 구하고
2. test 데이터로 그 확률값을 다시 예측하는 뭐 그런 방식인가요?
혹시 다시 보신다면 자세한 설명 한 번 부탁드려도 될까요???
저도 같은 방식으로 했습니다.
Teacher model은 [target = Y_LABEL]로 한 분류 모델로 만들어서 predict가 아닌 predict_proba를 구해줍니다.
Student model은 [target = predict_proba의 2번째 열 데이터]로 한 회귀 모델을 만들어서 예측했습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
머신러닝만으로 도전하시려면 한계가 있을 것 같습니다. 그럼에도 쓰고 싶으시다면 모델 predict할 때 input column 개수가 다르면 에러가 뜨는데 파라미터로 predict_disable_shape_check=True 사용하시면 column 개수 상관 없이 모델이 돌아가기는 합니다.