분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
encoding에 관련해서 질문드립니다.
분류 모델생성의 경우 숫자의 크기가 중요하지 않고, 회귀모델생성의 경우는 숫자 크기 자체가 중요하다고 들었습니다.
그래서 분류 모델을 만들 때, LabelEncoding과 같은 방법을 사용하고, 회귀모델의 경우 one-hot-encoding이나, dummies방법을 사용하는 것으로 알고 있습니다.
근데 다른사람들의 코드를 보면서 공부하다가 느꼈는데, 회귀모델에도 LabelEncoding을 사용하는 것을 보게 되었습니다. 이것에 대해서 알려주실 수 있으신분 계실까요..?
추가로. 월, 일 데이터는 연속형 범수로 보나요, 아니면 범주형 변수로 보나요..??
예시 확인해보겠습니다! 감사합니다!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
회귀모델을 중에도 데이터에 따라 Label encoding을 사용하는 경우가 있습니다.
또한 분류 모델을 만들 때에도, 데이터에 따라 one-hot encoding을 사용하는 경우도 더러 있습니다.
-> 예시) https://dacon.io/competitions/official/236064/overview/description
월, 일 데이터는 범주형 변수로 보는 것이 바람직합니다.