encoding에 관련해서 질문드립니다.

2023.07.21 15:38 850 조회

분류 모델생성의 경우 숫자의 크기가 중요하지 않고, 회귀모델생성의 경우는 숫자 크기 자체가 중요하다고 들었습니다.

그래서 분류 모델을 만들 때, LabelEncoding과 같은 방법을 사용하고, 회귀모델의 경우 one-hot-encoding이나, dummies방법을 사용하는 것으로 알고 있습니다.

근데 다른사람들의 코드를 보면서 공부하다가 느꼈는데, 회귀모델에도 LabelEncoding을 사용하는 것을 보게 되었습니다. 이것에 대해서 알려주실 수 있으신분 계실까요..?


추가로. 월, 일 데이터는 연속형 범수로 보나요, 아니면 범주형 변수로 보나요..??

로그인이 필요합니다
0 / 1000
EISLab_이희원
2023.07.22 15:31

회귀모델을 중에도 데이터에 따라 Label encoding을 사용하는 경우가 있습니다.
또한 분류 모델을 만들 때에도, 데이터에 따라 one-hot encoding을 사용하는 경우도 더러 있습니다.
 -> 예시) https://dacon.io/competitions/official/236064/overview/description

월, 일 데이터는 범주형 변수로 보는 것이 바람직합니다.

Idea경진대회
2023.07.25 11:18

예시 확인해보겠습니다! 감사합니다!