๋ถ์์๊ฐํ ๋ํ ์ฝ๋ ๊ณต์ ๊ฒ์๋ฌผ์
๋ด์ฉ ํ์ธ ํ
์ข์์(ํฌํ) ๊ฐ๋ฅํฉ๋๋ค.
๐ฃ ์ค๋์ ํ์ด์ฌ ๐ฃ
- ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋ถ๋ฌ์ค๊ธฐ (import)
- ํ์ผ ๋ถ๋ฌ์ค๊ธฐ (read_csv())
- ํ์ด๊ฐฏ์ ๊ด์ฐฐํ๊ธฐ (shape)
- ๋ฐ์ดํฐ ํ์ธํ๊ธฐ (head())
- ๊ฒฐ์ธก์น ์ ๋ฌด ํ์ธํ๊ธฐ isnull().sum()
- ๋ฐ์ดํฐ ๊ฒฐ์ธก์น ํ์ธํ๊ธฐ (info())
- ์์น๋ฐ์ดํฐ ํน์ฑ ๋ณด๊ธฐ (describe())
- Matplotlib ์ ๊ทธ๋ํ (plot())
- Matplotlib ํ์คํ ๊ทธ๋จ (hist())
- Seaborn ํ์คํ ๊ทธ๋จ (distplot())
- Seaborn ์ฐ์ ๋ ๊ทธ๋ํ (scatterplot())
- Seaborn ์ฐ์ ๋ ๊ทธ๋ํ (pairplot())
- Seaborn HeatMap ๊ทธ๋ํ(heatmap())
- ๊ฒฐ์ธก์น ์ญ์ ํ๊ธฐ, ๋์ฒดํ๊ธฐ (dropna(), fillna())
- ๊ฒฐ์ธก์น ํ๊ท ์ผ๋ก ๋์ฒด (fillna({mean}))
- ๊ฒฐ์ธก์น ๋ณด๊ฐ๋ฒ์ผ๋ก ๋์ฒด (interpolate())
- ์ด์์น ํ์ง seaborn_boxplot()
- ์์นํ ๋ฐ์ดํฐ ์ ๊ทํ MinMaxScaler()
- ์-ํซ ์ธ์ฝ๋ฉ OneHotEncoder()
- ๋ค์ค๊ณต์ ์ฑ ํด๊ฒฐ - ๋ณ์ ์ ๊ทํ
- ๋ค์ค๊ณต์ ์ฑ ํด๊ฒฐ - ๋ณ์ ์ ๊ฑฐ
- ๋ค์ค๊ณต์ ์ฑ ํด๊ฒฐ - PCA (1)
- ๋ค์ค๊ณต์ ์ฑ ํด๊ฒฐ - PCA (2)
- ๋ค์ค๊ณต์ ์ฑ ํด๊ฒฐ - PCA (3)
- ๋ชจ๋ธ๊ฐ๋ (Decision Tree)
- ๋ชจ๋ธ์ ์ธ (DecisionTreeClassifier())
- ๋ชจ๋ธ ์ ์ RandomForestClassifier()
- ๋๋คํฌ๋ ์คํธ ๋ณ์์ค์๋ ํ์ธ (feature_importances_)
- ํ์ดํผํ๋ผ๋ฏธํฐ, GridSearch ๊ฐ๋ (์ ์ง๊ท์น)
- GridSearch ๊ตฌํ (GridSearchCV())
๋ฐ์ด์ฝ(์ฃผ) | ๋ํ ๊น๊ตญ์ง | 699-81-01021
ํต์ ํ๋งค์
์ ๊ณ ๋ฒํธ: ์ 2021-์์ธ์๋ฑํฌ-1704ํธ
์์ธํน๋ณ์ ์๋ฑํฌ๊ตฌ ์ํ๋ก 3 ์ต์ค์ฝ๋ฒค์ฒํ์ 901ํธ
์ด๋ฉ์ผ dacon@dacon.io | ์ ํ๋ฒํธ: 070-4102-0545
Copyright โ DACON Inc. All rights reserved