분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
쉽게 따라할 수 있는 집값 예측 경진대회 EDA(ver.2)
안녕하세요. 제가 한 EDA 코드를 공유하고자 합니다.
이번에는 통계학과스럽게 EDA를 진행했던 것 같습니다.
제목은 '쉽게 따라할 수 있는'인데 제가 이전에 했던 코드들보다는 조금 어려울 수도 있을 것 같아요.
이해가 안되시는 부분 있다면 댓글 달아주세요! 가능한 빠르게 답변 드리겠습니다.
도움이 되셨다면 추천 부탁드립니다!
(기존 코드는 면적 변수들 부분 변수 명을 착각해서 EDA를 잘못했는데, 이 부분을 수정했습니다!)
제 깃허브 블로그에도 업로드 했으니 많은 방문 부탁드려요.
(https://ksy1526.github.io/myblog/)
좋게 봐주셔서 정말 감사합니다!
시각적 자료와 함께 자세히 설명되어있어서 많은 도움 되었습니다. 잘봤습니다!
많은 도움 되었다니 기쁘네요. 감사합니다!
잘 읽었습니다!-
잘 읽어주셔서 감사합니다!
친절하고 쉽게 설명해주셔서 감사합니다! 덕분에 EDA 공부하는데 많은 도움이 된 것 같습니다.
그리고 질문이 있는데 '면적 변수들' 부분에서 TotalBsmtSF를 '지상층 넓이'라고 적어두셨는데 Dacon 데이터 설명을 보면 '지하실 면적'으로 되어있던데 '지하실 면적'으로 이해하면 되는 부분일까요?
우선 좋게 봐주셔서 정말 감사합니다!
다시 한번 제 코드를 보니 면적 변수들 부분은 제가 변수 이름을 햇갈렸던 것 같습니다. 많은 분들에게 혼란을 준 것 같네요.
코드 내 오류를 잘 찾아줘서 감사드리고, 추후 수정해보도록 하겠습니다.
감사합니다.
질문이 있습니다. 리모델링을 한 주택 변수를 1과 -1로 바꾸는 과정에서 각 변수에 1과 -1을 선택하는 기준이 어떤 것인가요?
많이 배웠습니다! "통계학과스럽게"가 잘 느껴지는 EDA인것 같습니다!
우선 통계학과스럽게가 잘 느껴젔다는 것이 기쁘네요. 감사합니다.
질문하신 부분은 리모델링을 안한 주택을 1로 두었는데, 리모델링 안한 주택의 타겟값이 더 높았기 때문입니다.
그렇게 되면 리모델링 여부 변수가 타겟 변수와 양의 상관관계를 가져서 변수를 그렇게 두었던 것 같습니다.
다만 보기 좋으라고 -1, 1을 배치한 것이지 실제로 어떻게 배치하던 상관 없습니다.
EDA를 어떤 방식으로 진행해야 하고, 어떻게 데이터를 병합하거나 처리할지 몰랐는데, 도움 정말 많이 됐습니다. 감사합니다.
많은 도움 되었다니 기쁘네요. 좋은 댓글 남겨주셔서 감사합니다
삭제된 댓글입니다
이후 연속형 변수들을 표준화 할 것이기 때문에 이 변수도 평균을 0과 근사하게 하기 위해 모든 값을 6.5로 빼주겠습니다. 이부분이 연속형변수들은 표준화를 거칠것이기 때문에 이산형 변수들도 표준화(?)하기위해 평균을 0과 근사한것으로 이해하면 되나요?
네. 큰 효과가 있는지는 잘 모르겠으나 이해하신 바가 맞습니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
슨배님 많이 배우고 갑니다! ㅎㅎ