서두르세요! "데이스쿨 40% 할인" 12월 2일까지!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
encoding에 관련해서 질문드립니다.
분류 모델생성의 경우 숫자의 크기가 중요하지 않고, 회귀모델생성의 경우는 숫자 크기 자체가 중요하다고 들었습니다.
그래서 분류 모델을 만들 때, LabelEncoding과 같은 방법을 사용하고, 회귀모델의 경우 one-hot-encoding이나, dummies방법을 사용하는 것으로 알고 있습니다.
근데 다른사람들의 코드를 보면서 공부하다가 느꼈는데, 회귀모델에도 LabelEncoding을 사용하는 것을 보게 되었습니다. 이것에 대해서 알려주실 수 있으신분 계실까요..?
추가로. 월, 일 데이터는 연속형 범수로 보나요, 아니면 범주형 변수로 보나요..??
예시 확인해보겠습니다! 감사합니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
회귀모델을 중에도 데이터에 따라 Label encoding을 사용하는 경우가 있습니다.
또한 분류 모델을 만들 때에도, 데이터에 따라 one-hot encoding을 사용하는 경우도 더러 있습니다.
-> 예시) https://dacon.io/competitions/official/236064/overview/description
월, 일 데이터는 범주형 변수로 보는 것이 바람직합니다.