분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv3 전처리 1/4 python 파이썬 이상치탐지
데이터 중에는 이상치(Outlier) 가 존재합니다. 이상치는 말 그대로 이상(문제)이 있는 데이터입니다. 일반적인 데이터 패턴과 매우 다른 패턴을 갖는 데이터가 됩니다.
이러한 이상치 데이터는 모델의 성능을 크게 떨어트립니다. 오늘은 이러한 이상치를 탐지하는 법을 배우겠습니다.
대표적인 방법은 IQR (Inter Qunatile Range) 로, 사분위 값의 편차를 이용합니다. 이를 boxplot 그래프로 볼 수 있습니다.
import seaborn as sns
sns.boxplot(data=train['fixed acidity'])
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # read_csv
done
✅
✅
✅
✅
✅
done
✅
✅
✅
✅
✅
✅
✅
done
done
done
done
done
✅
done
done
✅
✅
✅
✅
✅
✅
✅
✅
done
✅
✅
done
done
done
done
✅
✅
done+
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
done