[신규 오픈 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[EDA] X_feature pearson 상관계수 시각화
공동작성자
pandas의 df.corr() 함수를 통해 pearson 상관계수를 구하고 seaborn heatmap으로 시각화 해봤습니다. X_04, X_23, X_47, X_48 value는 모두 1이라 drop했습니다.
소수점 둘째 자리에서 반올림
pearson 상관계수는 크기 0.2 부터 경향성이 있다고 보더라고요. 관련 feature들 가지고 new_feature 를 만들거나 drop시켜 보면서 전처리를 하면 될꺼같습니다
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
시각화 까지는 매우 좋았는데,
그 이후에 그러면 어느정도의 상관계수 값이어야 높은 것일까요? (th를 얼마나 잡아야 하나요?)
그러면 상관계수가 높은 feature들끼리는 어떻게 처리를 해야 할까요?