Task 전환: Classfication 에서 Anomaly detection.

2023.08.03 16:23 757 조회

안녕하세요. Time series data로 Classification 수행하고 있는 연구자입니다.

label 0,1 중 1을 제대로 detection을 해야 하는데, acc 만 높을 뿐 1을 판별하지 못합니다.


이런 경우 task를 전환하는 것이 가능한지요?


Anomaly detection으로 바꿀 수 있을까요


로그인이 필요합니다
0 / 1000
EISLab_이희원
2023.08.03 16:56

데이터에서 label 1의 갯수가 현저히 적으면, 1을 추론하지 못하는 문제가 발생합니다.
label 1에 weighted를 적용하는 방법이 있습니다.
sklearn의 compute_sample_weight를 적용해보시는 건 어떨까요?
https://scikit-learn.org/stable/modules/generated/sklearn.utils.class_weight.compute_sample_weight.html

화이트퍼그
2023.08.03 16:58

0 과 1 의 비율이 7:1 정도입니다. 그렇게 극단적으로 차이가 나지 않아서요.   그리고 보통 weight로 f1 score 해결 잘 못하지 않나요??

data는 univariate , 1분당 step count 입니다

EISLab_이희원
2023.08.03 17:05

그정도 비율이면, 극단적으로 차이가 나네요.....
weighted sampler를 적용하면 클래스 불균형을 해소할 수 있기에, 모델 일반화를 개선할 수 있습니다.
그렇게 되면, f1 score도 향상시킬 수 있습니다.

화이트퍼그
2023.08.03 17:48

dacon내에서 검색해보겠습니다