월간 데이콘 법원 판결 예측 AI 경진대회

알고리즘 | 언어 | 분류 | Accuracy

 

간단한 Text Preprocessing + RidgeClassifier

2023.06.29 04:56 2,810 Views language

데이터 전처리 + riverallzero님이 올려주신 다운샘플링 기법을 활용한 코드입니다. 
(https://dacon.io/competitions/official/236112/codeshare/8447?page=1&dtype=recent)

Text 토큰화로 차원이 매우 높으니, Tree계열 모델은 지양하는 것을 추천 드립니다.

brainAI_이희원님이 언급한 것 처럼(https://dacon.io/competitions/official/236112/talkboard/408426?page=1&dtype=recent)

LB스코어는 잘 나올 수 있지만 Private에서 점수 변동이 심할 수도 있으므로, 2가지 전략으로 제출하시면 좋을 것 같습니다.

Code
로그인이 필요합니다
0 / 1000
마도로스_탁이
2023.06.30 03:03

잘보고 갑니다 

지운지운
2023.06.30 15:11

안녕하세요. 지난 대회서부터 사랑개님 코드보며 공부 많이하는 초보 분석가입니다. 다른 accuracy가 높은 모델을 사용하지 않고  Ridge clf 로 predict를 한 이유가 무엇인가요? 

춘배사랑개
2023.06.30 18:43

AdaBoost와 KNN 둘 다 고차원에서 훈련이 제대로 되지않아서 차순위의 모델을 사용했습니다.