#오늘의 파이썬 #1일1오파

매일 오전10시 업로드, Dacon Daily Python Camp. 1일1오파 격파하기!

  • Prize : 교육
  • 30Team
  • D-101696

DACON_101: 머신러닝이 처음이라면 🤔

🏃‍♀️ [데이터 다운로드] 부터 ️[대회 제출] 까지 🏃‍♂



Lv1. 의사결정회귀나무로 따릉이 데이터 예측하기


🏃‍♂️Lv1 | EDA | 라이브러리 불러오기 (import)

⬇️Lv1 | EDA | 파일 불러오기 (read_csv())

🔍Lv1 | EDA | 행열갯수 관찰하기 (shape)

Lv1 | EDA | 데이터 확인하기 (head())

💣Lv1 | EDA | 결측치 확인하기 (is_null())


🧲Lv1 | 전처리 | 데이터 결측치 확인하기 (info())

🛠Lv1 | 전처리 | 결측치 삭제하기, 대체하기 (dropna(), fillna())


🌲Lv1 | 모델링 | scikit-learn (DecisionTreeClassifier)

👨‍🏫Lv1 | 모델링 | 모델개념 (의사결정나무)

🌳Lv1 | 모델링 | 모델선언 (DecisionTreeClassifier())

🏃Lv1 | 모델링 | 모델훈련 (fit())

✈️Lv1 | 모델링 | 테스트예측(predict())

🙋Lv1 | 모델링 | 제출파일생성(to_csv())


📝Lv1 | 복습


Lv2. 결측치 보간법과 랜덤포레스트로 따릉이 데이터 예측하기


🤔 Lv2 | 전처리 | 결측치 평균으로 대체 (fillna({mean}))

😲 Lv2 | 전처리 | 결측치 보간법으로 대체 (interpolate())


🔨 Lv2 | 모델링 | 랜덤포레스트 개념, 선언 (RandomForestRegressor())

✏️ Lv2 | 모델링 | 랜덤포레스트를 평가척도에 맞게 학습 (criterion='mse')


🔎 Lv2 | 튜닝 | 랜덤포레스트 변수중요도 확인 (feature_importances_)

Lv2 | 튜닝 | 변수 제거 (drop())

🧑‍🏫 Lv2 | 튜닝 | 하이퍼파라미터, GridSearch 개념 (정지규칙)

Lv2 | 튜닝 | GridSearch 구현 (GridSearchCV())


📝 Lv2 | 복습


Lv3. 교차검증과 LGBM 모델을 활용한 와인 품질 분류하기


🔎 Lv3 | EDA | read_csv(), info(), shape, head()

🤔 Lv3 | EDA | 결측치 유무 확인하기 isnull().sum()

🗂 Lv3 | EDA | 수치데이터 특성 보기 (describe())

📈Lv3 | EDA | Matplotlib 선 그래프 그리기 (plot())

🔲 Lv3 | EDA | Matplotlib 히스토그램 그리기 (hist())

📐 Lv3 | EDA | Matplotlib 막대그래프 그리기 (barplot())

Lv3 | EDA | 타깃 변수 분포 시각화 seaborn distplot()


👍 Lv3 | 전처리 | 이상치 탐지 seaborn_boxplot()

🎁 Lv3 | 전처리 | 이상치 제거 IQR

💕Lv3 | 전처리 | 수치형 데이터 정규화 MinMaxScaler()

🌏Lv3 | 전처리 | 원-핫 인코딩


#데이콘 #데이콘_101 #파이썬 #머신러닝 #딥러닝 #인공지능 #앙상블 #의사결정나무 #코랩 #데이터 #데이터분석 #판다스 #넘파이 #데이터사이언티스트 #AI #Python # Pandas #Numpy #lightgbm #read_csv #DACON #kaggle #sckit-learn

DACON_101: 머신러닝이 처음이라면 🤔

🏃‍♀️ [데이터 다운로드] 부터 ️[대회 제출] 까지 🏃‍♂



Lv1. 의사결정회귀나무로 따릉이 데이터 예측하기


🏃‍♂️Lv1 | EDA | 라이브러리 불러오기 (import)

⬇️Lv1 | EDA | 파일 불러오기 (read_csv())

🔍Lv1 | EDA | 행열갯수 관찰하기 (shape)

Lv1 | EDA | 데이터 확인하기 (head())

💣Lv1 | EDA | 결측치 확인하기 (is_null())


🧲Lv1 | 전처리 | 데이터 결측치 확인하기 (info())

🛠Lv1 | 전처리 | 결측치 삭제하기, 대체하기 (dropna(), fillna())


🌲Lv1 | 모델링 | scikit-learn (DecisionTreeClassifier)

👨‍🏫Lv1 | 모델링 | 모델개념 (의사결정나무)

🌳Lv1 | 모델링 | 모델선언 (DecisionTreeClassifier())

🏃Lv1 | 모델링 | 모델훈련 (fit())

✈️Lv1 | 모델링 | 테스트예측(predict())

🙋Lv1 | 모델링 | 제출파일생성(to_csv())


📝Lv1 | 복습


Lv2. 결측치 보간법과 랜덤포레스트로 따릉이 데이터 예측하기


🤔 Lv2 | 전처리 | 결측치 평균으로 대체 (fillna({mean}))

😲 Lv2 | 전처리 | 결측치 보간법으로 대체 (interpolate())


🔨 Lv2 | 모델링 | 랜덤포레스트 개념, 선언 (RandomForestRegressor())

✏️ Lv2 | 모델링 | 랜덤포레스트를 평가척도에 맞게 학습 (criterion='mse')


🔎 Lv2 | 튜닝 | 랜덤포레스트 변수중요도 확인 (feature_importances_)

Lv2 | 튜닝 | 변수 제거 (drop())

🧑‍🏫 Lv2 | 튜닝 | 하이퍼파라미터, GridSearch 개념 (정지규칙)

Lv2 | 튜닝 | GridSearch 구현 (GridSearchCV())


📝 Lv2 | 복습


Lv3. 교차검증과 LGBM 모델을 활용한 와인 품질 분류하기


🔎 Lv3 | EDA | read_csv(), info(), shape, head()

🤔 Lv3 | EDA | 결측치 유무 확인하기 isnull().sum()

🗂 Lv3 | EDA | 수치데이터 특성 보기 (describe())

📈Lv3 | EDA | Matplotlib 선 그래프 그리기 (plot())

🔲 Lv3 | EDA | Matplotlib 히스토그램 그리기 (hist())

📐 Lv3 | EDA | Matplotlib 막대그래프 그리기 (barplot())

Lv3 | EDA | 타깃 변수 분포 시각화 seaborn distplot()


👍 Lv3 | 전처리 | 이상치 탐지 seaborn_boxplot()

🎁 Lv3 | 전처리 | 이상치 제거 IQR

💕Lv3 | 전처리 | 수치형 데이터 정규화 MinMaxScaler()

🌏Lv3 | 전처리 | 원-핫 인코딩


#데이콘 #데이콘_101 #파이썬 #머신러닝 #딥러닝 #인공지능 #앙상블 #의사결정나무 #코랩 #데이터 #데이터분석 #판다스 #넘파이 #데이터사이언티스트 #AI #Python # Pandas #Numpy #lightgbm #read_csv #DACON #kaggle #sckit-learn