자율주행 센서의 안테나 성능 예측 AI 경진대회

알고리즘 | 정형 | 회귀 | 자율주행 | NRMSE

  • moneyIcon 상금 : 총 1,000만원
  • 2,042명 마감

 

[EDA] X_feature pearson 상관계수 시각화

공동작성자

stroke
2022.08.07 18:52 1,618 조회 language

pandas의 df.corr() 함수를 통해 pearson 상관계수를 구하고 seaborn heatmap으로 시각화 해봤습니다. X_04, X_23, X_47, X_48 value는 모두 1이라 drop했습니다.
소수점 둘째 자리에서 반올림

코드
로그인이 필요합니다
0 / 1000
jeongkpa
2022.08.07 19:39

시각화 까지는 매우 좋았는데,

그 이후에 그러면 어느정도의 상관계수 값이어야 높은 것일까요? (th를 얼마나 잡아야 하나요?)
그러면 상관계수가 높은 feature들끼리는 어떻게 처리를 해야 할까요?

planting
2022.08.07 20:24

pearson 상관계수는 크기 0.2 부터 경향성이 있다고 보더라고요. 관련 feature들 가지고 new_feature 를 만들거나 drop시켜 보면서 전처리를 하면 될꺼같습니다