분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv1 모델링 python 파이썬 2/6 모델개념(의사결정나무)
오늘은 의사결정나무 모델을 설명드리겠습니다. 📣
의사결정나무란? 🤷
결정 트리는 의사 결정 규칙과 그 결과들을 트리 구조로 도식화한 의사 결정 지원 도구의 일종입니다. 즉 스무고개 방식으로 구조화되는 것입니다.
원리를 살펴보겠습니다. 🧑🏫
EDA 를 통해 data를 살펴보면 각 행(row) 들은 피쳐들을 갖고 있습니다. 이 중 하나의 피쳐를 정해서 해당 피쳐의 값에 대해 특정한 하나의 값을 정한다면, 이를 기준으로 모든 행(row) 들을 두 개의 노드(node) 로 분류(Binary decision rule. 이진분할) 할 수 있습니다. ✅
만약 특정하게 2️⃣개를 정한다면 3️⃣진분할이 되는 것입니다. 대표적인 의사결정나무인 CART 의사결정 나무 는 이진분할을 사용합니다. 앞으로 CART 의사결정나무에 맞춰 설명을 이어나가겠습니다.
자 그럼, 🔄 파생된 두 개의 노드에 대해서 또 다시 새로운 피쳐의 특정한 값을 정하고 분류를 진행합니다. 그리고 이 과정을 반복하게 되면 점차 피쳐의 값에 따라 data 들이 분류가 되며 이것이 의사결정 나무의 원리입니다. 🌳
특정한 값을 정하는 의사결정 나무의 대원칙은 ✅ "한쪽 방향으로 쏠리도록" ✅ 입니다. 🙅 분류될 때는 공평하게 비슷한 양으로 나뉘도록 값을 정하는 것이 아니라, 🙆 "한쪽 방향으로 쏠리도록" 해주는 특정한 값을 찾는 것이며, 이를 불순도를 계산해서 찾아냅니다.
의사결정나무 모델은 scikit-learn 에서 모듈을 불러올 수 있습니다.
import sklearn from sklearn.tree import DecisionTreeClassifier
더 자세한 원리를 알고 싶으신 분은 DACON.kyle 님의 Github 을 참고하세요
⬅️ Lv1 | 모델링 | 1/6 | Sklearn 패키지
Lv1 |모델링 | 3/6 | 모델선언(의사결정나무)➡️
↩️ 오늘의 파이썬 리스트
#데이콘 #데이콘_101 #파이썬 #머신러닝 #딥러닝 #인공지능 #앙상블 #의사결정나무 #코랩 #데이터 #데이터분석 #판다스 #넘파이 #데이터사이언티스트 #AI #Python # Pandas #Numpy #lightgbm #read_csv #DACON #kaggle #sckit-learn
✅
✅
done
done
✅
✅
✅
✅
✅
done
✅
done
✅
✅
✅
✅
✅
✅
✅
Done
done
✅
✅
✅
done
✅
done
✅
✅
done
mission clear
✅
✅
✅
✅
done
✅
✅
✅
done
✅
✅
done
✅
✅
✅
✅
✅
done
✅
✅
✅
done
done
done
✅
done
✅
✅
done
✅
✅
done
done
done
ThankYou
✅
done
✅
✅
✅
✅
✅
✅
done
✅
done
✅
✅
✅
done
✅
done
done
✅
✅
✅
✅
✅
✅
✅
done
done
done
✅
done
✅
✅
✅
done
✅
✅
✅
✅
✅
✅
✅
Done
done
✅
✅
✅
✅
✅
✅
✅
done
done
😀
✅
✅
✅
완료
완료
done
✅
done
✅
✅
done
done
✅
✅
✅
done
done
✅
✅
✅
done
✅
✅
✅
✅
✅
✅
done+
done
done
✅
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
✅