집값 예측 AI해커톤

정형 | NMAE

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 693명 마감

 

쉽게 따라할 수 있는 집값 예측 경진대회 EDA(ver.2)

2022.01.30 02:55 5,568 Views language

안녕하세요. 제가 한 EDA 코드를 공유하고자 합니다.
이번에는 통계학과스럽게 EDA를 진행했던 것 같습니다.
제목은 '쉽게 따라할 수 있는'인데 제가 이전에 했던 코드들보다는 조금 어려울 수도 있을 것 같아요.
이해가 안되시는 부분 있다면 댓글 달아주세요! 가능한 빠르게 답변 드리겠습니다.
도움이 되셨다면 추천 부탁드립니다!
(기존 코드는 면적 변수들 부분 변수 명을 착각해서 EDA를 잘못했는데, 이 부분을 수정했습니다!)

제 깃허브 블로그에도 업로드 했으니 많은 방문 부탁드려요.
(https://ksy1526.github.io/myblog/)

Code
로그인이 필요합니다
0 / 1000
부스트캠프7기_T7251
2022.01.30 14:10

슨배님 많이 배우고 갑니다! ㅎㅎ

ssu통계학과
2022.01.30 15:39

좋게 봐주셔서 정말 감사합니다!

chloe★
2022.01.31 00:54

시각적 자료와 함께 자세히 설명되어있어서 많은 도움 되었습니다. 잘봤습니다!

ssu통계학과
2022.02.01 21:23

많은 도움 되었다니 기쁘네요. 감사합니다!

dlaguddnr
2022.02.01 16:44

잘 읽었습니다!-

ssu통계학과
2022.02.01 21:23

잘 읽어주셔서 감사합니다!

flimsh
2022.02.04 00:49

친절하고 쉽게 설명해주셔서 감사합니다! 덕분에 EDA 공부하는데 많은 도움이 된 것 같습니다. 

그리고 질문이 있는데 '면적 변수들' 부분에서 TotalBsmtSF를 '지상층 넓이'라고 적어두셨는데 Dacon 데이터 설명을 보면 '지하실 면적'으로 되어있던데 '지하실 면적'으로 이해하면 되는 부분일까요?

ssu통계학과
2022.02.04 11:58

우선 좋게 봐주셔서 정말 감사합니다!

다시 한번 제 코드를 보니 면적 변수들 부분은 제가 변수 이름을 햇갈렸던 것 같습니다. 많은 분들에게 혼란을 준 것 같네요.

코드 내 오류를 잘 찾아줘서 감사드리고, 추후 수정해보도록 하겠습니다.

감사합니다.

dong_ho
2022.02.07 16:03

질문이 있습니다. 리모델링을 한 주택 변수를 1과 -1로 바꾸는 과정에서 각 변수에 1과 -1을 선택하는 기준이 어떤 것인가요?
많이 배웠습니다! "통계학과스럽게"가 잘 느껴지는 EDA인것 같습니다!

ssu통계학과
2022.02.07 19:51

우선 통계학과스럽게가 잘 느껴젔다는 것이 기쁘네요. 감사합니다.

질문하신 부분은 리모델링을 안한 주택을 1로 두었는데, 리모델링 안한 주택의 타겟값이 더 높았기 때문입니다.

그렇게 되면 리모델링 여부 변수가 타겟 변수와 양의 상관관계를 가져서 변수를 그렇게 두었던 것 같습니다.

다만 보기 좋으라고 -1, 1을 배치한 것이지 실제로 어떻게 배치하던 상관 없습니다. 

다냐니라
2022.02.14 00:02

EDA를 어떤 방식으로 진행해야 하고, 어떻게 데이터를 병합하거나 처리할지 몰랐는데, 도움 정말 많이 됐습니다. 감사합니다.

ssu통계학과
2022.02.14 20:15

많은 도움 되었다니 기쁘네요. 좋은 댓글 남겨주셔서 감사합니다

비회원
2022.02.14 09:46

삭제된 댓글입니다

꿀지
2022.07.12 10:26

이후 연속형 변수들을 표준화 할 것이기 때문에 이 변수도 평균을 0과 근사하게 하기 위해 모든 값을 6.5로 빼주겠습니다. 이부분이 연속형변수들은 표준화를 거칠것이기 때문에 이산형 변수들도 표준화(?)하기위해 평균을 0과 근사한것으로 이해하면 되나요?

ssu통계학과
2022.07.12 14:31

네. 큰 효과가 있는지는 잘 모르겠으나 이해하신 바가 맞습니다!