중고차 가격 예측 AI 해커톤

정형 | NMAE

  • moneyIcon 상금 : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 600명 마감

 

EDA + autoML(pycaret) Ensemble (0.2686)

2022.06.07 14:38 2,102 조회 language

많은 분들의 코드를 보고 많은 공부가 되었습니다.

아직 초보자라 잘못한점 지적해주시면 감사합니다!

코드 공유는 처음해보는데, 질문있으시면 댓글로 남겨주세요!

코드
로그인이 필요합니다
0 / 1000
bluestruggle
2022.06.07 15:45

브랜드와 엔진에 등급 점수를 주고, 편향된 데이터 학습, 무광, 유광 feature를 추가한다는 것은 생각도 못했네요. 
감사합니다.

그리즐리
2022.06.07 21:26

코드 봐주셔서 감사합니다!

백남진
2022.06.07 15:46

무채색 유채색 흥미롭네요, 저도 한 번 추가해보고 싶네요 :)

Data Leakage에 대해 질문이 있습니다.
test['paint'] 값들을 replacing 하셨는데, Data Leakage가 아닌지 여쭈어봅니다.

그리즐리
2022.06.07 21:25

안녕하세요! 
test의 paint 값들을 바꾼 기준이 약간 dark gray를 gray로 바꾸듯이 같은 계열로 바꾼건데 이 경우도 데이터 누수가 되는걸까요..? 제가 아직 초보자라서 잘 모르겠습니다..!!

감사합니다!

백남진
2022.06.07 22:36

음 , 저는 test의 값은 저는 미지의 데이터라 생각해서 값을 변경한다던지, 사용한다던지 하지 않았던 것 같습니다.
근데 어떻게 보면 오타로 추측할 수 있는 value라면 수정해주는 게 맞다고 생각이 드네요 :)

그리즐리
2022.06.07 23:26

저두 data leakage에 대해서 좀더 공부 해봐야겠어요.
감사합니다!!

백남진
2022.06.07 23:37

앞으로도 응원합니다! 저도 그리즐리님 followup 하겠습니다.

soobahkin
2022.06.09 09:45

삭제된 댓글입니다

BACS_뱁새킹
2022.06.09 22:43

Title은 학습데이터에서 삭제한 것인가요??

그리즐리
2022.06.10 14:20

삭제도 해봤는데 정확도가 오히려 떨어져서 그대로 사용했습니다!