feature selection 관련 질문입니다.

2023.07.13 12:26 670 Views

feature_selection관련 질문입니다.

lg aimers 데이터로 공부를 해보고 있는 중인데요.

feature가 2000개가 넘는 dataset이라 어떤 방식으로 변수 선택을 해야될지 모르겠습니다.

제가 궁금한 것은 다음과 같습니다.

  1. rfecv나 selectKBest 모델이 있는 것을 확인했는데 다른 분들은 어떤 방식으로 변수선택 개수를 최적화해서 모델을 생성하는지 궁금합니다.
  2. xgboost모델을 사용하면 feature_importance를 알 수 있는 것을 알고 있습니다. 근데 xgboost에서 중요하다고 생각되는 feature가 다른 모델에서도 중요하게 사용되는지 궁금합니다.