범주형 데이터 처리 질문드립니다

2022.11.06 03:06 1,270 조회
typeSize.csv

가로 세로 길이로 크기 예측하는 코드입니다.

roc 곡선이랑 정밀도, 재현도 f1 등등 구하려고 보니까

ValueError: multiclass format is not supported


이 에러가 뜹니다


저게 범주형 데이터라 지원되지 않는다는 뜻 같아서

df = pd.DataFrame([1, 2, 3], columns=["x"])

df

dmatrix("C(x) + 0", df)

이걸 해주었는데도 에러가 사라지지 않습니다.


forest.fit(X_train, y_train)

y_pred = forest.predict(X_test)

print('잘못 분류된 샘플 개수: %d' % (y_test != y_pred).sum())

print('정확도: %.3f' % accuracy_score(y_test, y_pred))

print('정밀도: %.3f' % precision_score(y_true=y_test, y_pred=y_pred))

print('재현율: %.3f' % recall_score(y_true=y_test, y_pred=y_pred))

print('F1: %.3f' % f1_score(y_true=y_test, y_pred=y_pred))

Target is multiclass but average='binary'. Please choose another average setting, one of [None, 'micro', 'macro', 'weighted'].



여기도 정확도까지만 나오고 다음것은 나오지 않습니다.