분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
건설기계 오일 상태 분류 AI 경진대회
Bagging classifier를 이용하여 feature importance를 추출
train 데이터에서 Bagging classifier를 이용하여 feature importance를 추출해보았습니다.
어떤 데이터가 Y_LABEL에 큰 영향을 주는지 보려고 했는데.. 앞서 말씀하신것처럼 AL이 가장 큰 걸로 보입니다.
그래서 test column에 속한 feature들로 AL을 맞춰보려 노력했는데 rmse가 거의 8000정도 나옵니다.
feature 생성이나 regressor로 AL을 맞춰야 할 것 같습니다.
저도 높은 score를 얻지는 못한 상태여서 이게 맞는지는 모르겠습니다. 그런데 문제 특성상 지식 전이 (knowledge distillation)에 부과점을 주는걸로 미루어 볼때, 다른 DL로는 풀 수 있고 DL에서는 이런 feature에 대한 영향력을 분석할 수 있기 때문이라고 생각이 들었습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
저는 반대로 생각하고 있었네요~ AL의 영향력이 너무 크므로 drop해야 한다고 생각했는데요... AL을 더 잘 맞출 수 있게 해야 하군요!! 공유 감사합니다!