월간 데이콘 쇼츠 - 뉴스 기사 레이블 복구 해커톤

알고리즘 | 언어 | 분류 | 클러스터링 | 라벨링 | Macro F1 Score

  • moneyIcon 상금 : 인증서
  • 474명 마감

 

[Private 2nd] gte/large + KMeans

2023.09.25 15:00 1,122 조회 language

고생하셨습니다!

PDF
코드
로그인이 필요합니다
0 / 1000
머홍
2023.09.25 22:01

잘봤습니다! 사실 클러스터링에 조금 일가견이 없었기도 했고, 너무 늦게 대회를 알아버려서( 마치기 8시간 전에..), 그냥 BaseLine 코드만 쓰고 제출하고, 추후에 수상작 코드들을 따라해봐야지.. 하면서, 이번에 하신 코드를 보고 따라해봤습니다.

이번 대회는 모델을 선정만 잘하고, 모델 후처리(Post-Processing)과정에서 정확한 라벨로 바꾸기만한다면, 모델만바꾼 BaseLine코드로도 고성적이 나오는 걸 확인했습니다. (0.81점 대로 Public(대회 후 연습) 3위성적이 가능했습니다)아마 저도 모델을 어떤걸 사용할 지만 조금만 고민했더라면.. 이라는 생각이 들었습니다.  
다들 수고하셨습니다. 그리고, 이번기회에 모델 선정의 중요성을 익히게 되었네요! 

호두마르
2023.10.04 12:38

도움이 되었다니 정말 다행입니다. 감사합니다!!

몽한녀석
2023.09.26 10:04

더 성능좋은 모델을 찾는법을 몰랐는 hugging face라는게 있는지를 처음알았네요 감사합니다

호두마르
2023.10.04 12:39

 hugging face 요즘 정말 많이 쓰여서 공부하면 좋아요!!

JJeongdahoon
2023.10.03 00:59

안녕하세요! 코드 공부중에 우연히 보게되었습니다. 좋은 코드 공유해주셔서 감사합니다! 궁금한 점이 있는데,

임베딩 부분에서 df_embeddings = pd.DataFrame(sentence_embeddings) 해당 코드는 만드신 이유가 궁금합니다. 이후 코드에 쓰인게 아닌거 같아서요!

호두마르
2023.10.03 01:40

baseline에서 수정한거라 이유가 없네요...ㅎㅎ 없어도 되는 코드 입니다!!

JJeongdahoon
2023.10.03 01:55

답변 감사합니다 ~!