Dacon Monthly Shorts - News Articles Labels Restoration Hackathon

Algorithm | NLP | Classification | Clustering | Labeling | Macro F1 Score

  • moneyIcon Prize : 인증서
  • 521 Users Completed

 

[Baseline] SentenceBERT + KMeans

2023.09.21 15:08 2,666 Views language

안녕하세요. 데이콘입니다.

해당 베이스라인은 모든 참가자의 '제출'을 목표로 하며, 
text embedding을 추출하고 이를 clustering하는 방식으로 구현되었습니다.

이외에도 다양한 방식으로 문제에 접근해 보시기를 권장드립니다.
베이스라인이 여러분만의 고도화된 모델 작성에 도움이 되면 좋겠습니다.

감사합니다. 
데이콘 chanmuzi 드림

Code
Login Required
0 / 1000
plmokn
2023.09.22 17:19

mapping dict 이 잘못된 것 같습니다 확인부탁드려요.. business 2-> 0 이런 식으로 되야하는 거죠?

DACON.chanmuzi
2023.09.22 17:32

안녕하세요, gidometa 님.

결과물을 후처리하는 과정에서 변경된 내용이 반영되지 않았던 것을 확인했습니다.
실제 mapping하는 값이 달라지지 않기 때문에 score는 동일하게 유지됩니다. 
혼동을 드려 죄송합니다.

감사합니다. 

Previous
[Private 4th] pre-processing + GTE-large
Competition - 월간 데이콘 쇼츠 - 뉴스 기사 레이블 복구 해커톤
Likes 19
Views 1,556
Comments 0
2년 전
Current
[Baseline] SentenceBERT + KMeans
Competition - 월간 데이콘 쇼츠 - 뉴스 기사 레이블 복구 해커톤
Likes 10
Views 2,666
Comments 2
2년 전
Next
No Next Post