Python 튜토리얼

기초

  • moneyIcon Prize : 교육
  • 9,999명 D-100720

 

Lv2 튜닝 3/4 python 파이썬 하이퍼파라미터 / GridSearch 개념

2021.07.05 15:21 5,280 Views

하이퍼파라미터 튜닝은 정지규칙 값들을 설정하는 것을 의미합니다. 의사결정나무에는 정지규칙(stopping criteria) 이라는 개념이 있는데

오늘 소개해드릴 4가지 정지규칙은

1. 최대깊이 (max_depth)

2. 최소 노드크기(min_samples_split)

3. 최소 향상도(min_impurity_decrease)

4. 비용복잡도(Cost-complexity)

입니다.


최대깊이최대로 내려갈 수 있는 depth 입니다. 뿌리 노드로부터 내려갈 수 있는 깊이를 지정하며 작을수록 트리는 작아지게 됩니다.

최소 노드크기노드를 분할하기 위한 데이터 수 입니다. 해당 노드에 이 값보다 적은 확률변수 수가 있다면 stop. 작을수록 트리는 커지게 됩니다.

최소 향상도는 노드를 분할하기 위한 최소 향상도 입니다. 향상도가 설정값 이하라면 더 이상 분할하지 않습니다. 작을수록 트리는 커집니다.

비용 복잡도는 트리가 커지는 것에 대해 패널티 계수를 설정해서 불순도와 트리가 커지는 것에 대해 복잡도를 계산하는 것입니다.


이와 같은 정지규칙들을 종합적으로 고려해 최적의 조건값을 설정할 수 있으며 이를 하이퍼파라미터 튜닝이라고 합니다.


하이퍼파라미터 튜닝에는 다양한 방법론이 있습니다. 그 중 Best 성능을 나타내는 GridSearch는 완전 탐색(Exhaustive Search) 을 사용합니다. 가능한 모든 조합 중에서 가장 우수한 조합을 찾아줍니다. 하지만, 완전 탐색이기 때문에 Best 조합을 찾을 때까지 시간이 매우 오래 걸린다는 단점이 있습니다.



⬅️ Lv2 튜닝 2/5 변수 제거 /

Lv2 튜닝 4/5 GridSearch 구현 ➡️

↩️ 오늘의 파이썬 리스트


#데이콘 #데이콘_101 #파이썬 #머신러닝 #딥러닝 #인공지능 #앙상블 #의사결정나무 #코랩 #데이터 #데이터분석 #판다스 #넘파이 #데이터사이언티스트 #AI #Python # Pandas #Numpy #lightgbm #read_csv #DACON #kaggle #sckit-learn

로그인이 필요합니다
0 / 1000
정장입고시퍼요
2021.08.02 15:58

done

분석을할상인가
2021.08.06 00:08

그린티
2021.09.02 14:26

DSJY
2021.09.08 18:11

매미인턴
2021.09.09 16:49

다욤
2021.09.12 18:55

찬찬이
2021.09.24 14:59

changhyeon
2021.09.29 21:47

done

ym99
2021.10.18 23:44

TODO

coddinggoldfish
2021.11.16 00:35

cberrys
2021.11.19 22:34



sunnydays
2021.11.27 13:42

지금노플
2021.12.08 14:05

Hod0ri
2021.12.10 21:53

비회원
2021.12.13 00:10

Soohobi
2021.12.15 15:53

녹삭
2021.12.18 21:14

done

moran
2021.12.27 14:52

s_nana
2021.12.28 12:15

MMMMMMMMMMMMMMMMMMMM
2022.01.01 04:15

201702018
2022.01.05 18:57

하랴랴
2022.01.06 20:55

jj150618
2022.01.17 01:10

dbnoid
2022.01.18 18:55

hijihyo
2022.01.18 23:12

done

호랭이띠
2022.01.27 20:55

done

곽진섭
2022.01.29 00:24

thanks

찹쌀아빠
2022.02.10 13:01

일렁
2022.02.16 19:26

ChimChim
2022.02.20 00:00

하랴랴
2022.02.28 16:26

acebed
2022.03.10 17:58

done

으아아아악
2022.03.16 15:29

kimgugu
2022.03.16 19:55

졔이
2022.03.22 22:37

비회원
2022.04.05 16:08

Kdata
2022.04.06 18:20

KIM2327
2022.05.16 09:32

jaka
2022.06.07 02:54

dnd404
2022.06.30 13:58

dirno
2022.07.04 17:23

qprz
2022.07.12 20:11

5번문제 답을 보면 여기도 코랩실습이 있어야할것같은데 없는 느낌적 느낌

MINKYU
2022.07.20 02:16

nigel
2022.07.21 09:58

whdgus928
2022.07.26 15:33

done

우주인
2022.07.26 15:35

SauberHands
2022.08.07 16:46

간지나는패션
2022.08.12 15:11

done

굿전
2022.08.30 15:55

완료

재상쓰
2022.09.19 12:22

done

baeksh0330
2022.09.25 13:25

엿장수
2022.10.10 21:57

gnt0000
2022.10.27 22:12

done

sk100
2022.11.01 14:56

done

yun_
2022.11.14 18:00

done

savvyall
2022.11.30 14:36

done

히히로켓발사
2022.12.27 02:17

유정잉
2023.01.05 18:42

ickhwan
2023.01.11 17:51

done

highllight
2023.01.12 12:44

김시옷
2023.05.29 17:52

done+

johnchoi44
2023.06.02 17:24

done

이전 글
인덱싱을 위한 Pandas .iloc .loc 사용 방법 데이터 분석 및 조작을위한
Competition - Python 튜토리얼
Likes 4
Views 1,706
Comments 0
일 년 전
현재 글
Lv2 튜닝 3/4 python 파이썬 하이퍼파라미터 / GridSearch 개념
Competition - Python 튜토리얼
Likes 31
Views 5,280
Comments 64
3년 전
다음 글
다음 글이 존재하지 않습니다.