Python 튜토리얼

기초

  • moneyIcon 상금 : 교육
  • 9,999명 D-100719

 

Lv3 EDA 4/7 python 파이썬 변수분포 시각화

2021.07.14 15:00 3,660 조회

Lv3 부터 EDA 과정에 시각화를 진행합니다. 가장 중요한 변수, 예측하고자 하는 변수인 종속변수(quality) 의 분포를 시각화해보겠습니다.


matplotlib, seaborn 라이브러리로 시각화를 출력할 수 있습니다. 시각화 결과를 통해 머신러닝 방향성을 잡을 수 있습니다.

-------------------------------------------------------------------------------

import matplotlib

import matplotlib.pyplot as plt

import seaborn as sns

-------------------------------------------------------------------------------


시각화를 진행할 때는 보통 copy() 매서드로 복사본을 생성한 후 진행합니다.

-------------------------------------------------------------------------------

dfcopy = df.copy()

-------------------------------------------------------------------------------


seaborn 의 distplot() 매서드를 이용합니다.

-------------------------------------------------------------------------------

sns.distplot(df['피쳐명'], kde=True, bins=None)

df['피쳐명']: 출력하고자 하는 컬럼

kde: '그래프에 선을 출력할지 여부'

bins: '출력할 막대그래프 갯수'

-------------------------------------------------------------------------------


matplotlib 의 axis() 매서드로 그래프 축의 최솟값, 최댓값을 지정할 수 있습니다.

-------------------------------------------------------------------------------

plt.axis(['x 축 최솟값, x 축 최댓값, y 축 최솟값, y 축 최댓값'])

-------------------------------------------------------------------------------


matplotlib 의 title() 매서드로 그래프의 제목을 지정할 수 있습니다.

-------------------------------------------------------------------------------

plt.title('제목')

-------------------------------------------------------------------------------


matplotlib 의 show() 매서드로 그래프를 출력할 수 있습니다.

-------------------------------------------------------------------------------

plt.show()

-------------------------------------------------------------------------------


[Colab 실습 링크]


↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선  #데이터분석 #데이터사이언티스트 #코랩 #Python  #colab #kaggle #pandas #numpy #sckit-learn # read_csv



로그인이 필요합니다
0 / 1000
세라자데
2021.09.02 15:18

done

그린티
2021.09.03 09:04

done

phu
2021.09.06 22:33

DSJY
2021.09.13 15:41

매미인턴
2021.09.14 13:23

다욤
2021.09.19 00:11

찬찬이
2021.09.24 16:27

지내니
2021.09.26 02:10



Holte
2021.09.30 13:29

changhyeon
2021.10.08 16:24

done

왼쪽눈썹왁싱
2021.10.31 09:28

coddinggoldfish
2021.11.17 13:29

yulia.
2021.11.23 20:12

sotanfdl
2021.12.10 13:29

하잉바
2021.12.22 17:08

moran
2021.12.27 15:43

dbnoid
2022.01.18 19:11

hijihyo
2022.01.21 15:50

done

djffjdEndEkd
2022.01.28 15:38

done

호랭이띠
2022.01.29 18:31

하랴랴
2022.02.28 17:37

done

ChimChim
2022.03.01 23:59

acebed
2022.03.10 17:59

done

하얀레몬
2022.03.16 17:06

done

kimgugu
2022.03.27 10:36

비회원
2022.04.05 17:07

Kdata
2022.04.19 09:14

krooner
2022.05.19 14:44

khloee
2022.05.26 14:57

jaka
2022.06.16 06:36

dirno
2022.07.06 18:36

양현모든지쓸어버리겠다
2022.07.07 09:18

MINKYU
2022.07.22 00:27

nigel
2022.07.22 09:57

done

우주인
2022.07.29 15:09

간지나는패션
2022.08.12 15:31

done

재상쓰
2022.09.23 00:28

done

skanehfud279
2022.09.23 15:48

baeksh0330
2022.10.02 17:02

한기혁
2022.10.04 22:22

done

엿장수
2022.10.12 00:41

gnt0000
2022.10.30 20:27

done

sk100
2022.11.01 21:35

done

yun_
2022.11.14 19:36

done

savvyall
2022.11.30 15:25

done

히히로켓발사
2022.12.29 00:33

highllight
2023.01.16 14:54

김시옷
2023.05.28 19:22

done+

이전 글
인덱싱을 위한 Pandas .iloc .loc 사용 방법 데이터 분석 및 조작을위한
대회 - Python 튜토리얼
좋아요 4
조회 1,710
댓글 0
일 년 전
현재 글
Lv3 EDA 4/7 python 파이썬 변수분포 시각화
대회 - Python 튜토리얼
좋아요 19
조회 3,660
댓글 48
3년 전
다음 글
다음 글이 존재하지 않습니다.