건설기계 오일 상태 분류 AI 경진대회

Bagging classifier를 이용하여 feature importance를 추출

2022.12.01 01:29 1,904 Views

train 데이터에서 Bagging classifier를 이용하여 feature importance를 추출해보았습니다.

어떤 데이터가 Y_LABEL에 큰 영향을 주는지 보려고 했는데.. 앞서 말씀하신것처럼 AL이 가장 큰 걸로 보입니다.

그래서 test column에 속한 feature들로 AL을 맞춰보려 노력했는데 rmse가 거의 8000정도 나옵니다.

feature 생성이나 regressor로 AL을 맞춰야 할 것 같습니다.

PDF
로그인이 필요합니다
0 / 1000
alphakoo
2022.12.01 09:01

저는 반대로 생각하고 있었네요~ AL의 영향력이 너무 크므로 drop해야 한다고 생각했는데요... AL을 더 잘 맞출 수 있게 해야 하군요!! 공유 감사합니다!

rh
2022.12.01 13:29

저도 높은 score를 얻지는 못한 상태여서 이게 맞는지는 모르겠습니다. 그런데 문제 특성상 지식 전이 (knowledge distillation)에 부과점을 주는걸로 미루어 볼때, 다른 DL로는 풀 수 있고 DL에서는 이런 feature에 대한 영향력을 분석할 수 있기 때문이라고 생각이 들었습니다.