월간 데이콘 쇼츠 - 뉴스 기사 레이블 복구 해커톤

알고리즘 | 언어 | 분류 | 클러스터링 | 라벨링 | Macro F1 Score

  • moneyIcon 상금 : 인증서
  • 474명 마감

 

[Baseline] SentenceBERT + KMeans

2023.09.21 15:08 1,526 조회 language

안녕하세요. 데이콘입니다.

해당 베이스라인은 모든 참가자의 '제출'을 목표로 하며, 
text embedding을 추출하고 이를 clustering하는 방식으로 구현되었습니다.

이외에도 다양한 방식으로 문제에 접근해 보시기를 권장드립니다.
베이스라인이 여러분만의 고도화된 모델 작성에 도움이 되면 좋겠습니다.

감사합니다. 
데이콘 chanmuzi 드림

코드
로그인이 필요합니다
0 / 1000
plmokn
2023.09.22 17:19

mapping dict 이 잘못된 것 같습니다 확인부탁드려요.. business 2-> 0 이런 식으로 되야하는 거죠?

DACON.chanmuzi
2023.09.22 17:32

안녕하세요, gidometa 님.

결과물을 후처리하는 과정에서 변경된 내용이 반영되지 않았던 것을 확인했습니다.
실제 mapping하는 값이 달라지지 않기 때문에 score는 동일하게 유지됩니다. 
혼동을 드려 죄송합니다.

감사합니다. 

이전 글
[Private 4th] pre-processing + GTE-large
대회 - 월간 데이콘 쇼츠 - 뉴스 기사 레이블 복구 해커톤
좋아요 19
조회 758
댓글 0
8달 전
현재 글
[Baseline] SentenceBERT + KMeans
대회 - 월간 데이콘 쇼츠 - 뉴스 기사 레이블 복구 해커톤
좋아요 9
조회 1,526
댓글 2
8달 전
다음 글
다음 글이 존재하지 않습니다.