2024 용인시와 함께하는 한국외대 SW중심대학 - GBT 해커톤 경진대회

알고리즘 | 언어 | 분류 | Macro F1 Score

 

[Private Score 0.63] Word2Vec + RandomForest

공동작성자
2024.11.06 15:27 420 조회 language

제목 필드를 형태소로 추출 후 키워드와 합쳐 x_train 데이터로 활용했습니다. word2Vec을 사용해 벡터화했습니다. 클래스 불균형을 확인하고 오버샘플링 기법으로 ADASYN 라이브러리를 사용했습니다 subsample 데이터로 하이퍼파라미터 튜닝을 진행 후 해당 파라미터들을 가지고 randomforest를 학습시켜 결과를 도출했습니다.

코드