데이스쿨 할인 리턴-즈!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
private 4th 0.97478) Phoneme based Gemma2 2b Encoder
다들 수고하셨습니다.
저는 대회 매트릭상 고정된 위치의 출력을 생성할 수 있는 인코더 방식이 적합하다고 생각하고, 단어나 글자단위보다는 자음/모음 단위의 교정이 필요하다고 생각했습니다.
gemma모델이 한글과 한글을 초중종성으로 나눴을때의 이해도가 높다고 판단되어서 gemma 모델을 encoder로 변환하여 대회를 진행했습니다.
public 기준 0.972 -> 0.974(+데이터증강) ->0.975(+후처리) 순으로 성능이 증가했습니다.
잘 읽어주셔서 감사합니다!
아이디어가 진짜 좋네요. 덕분에 정말 많이 배웠습니다!
감사합니다~
감사합니다 ㅎㅎ
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
LLM2Vec을 보고 이런 생각을 하셨다는 게 정말 신기하네요,, 좋은 아이디어 공유해주셔서 감사합니다!