월간 데이콘 코드 유사성 판단 AI 경진대회

알고리즘 | NLP | 분류 | 유사성 | Accuracy

  • moneyIcon 상금 : 총 600만 원
  • 908명 마감

 

SBERT library를 활용한 baseline (LB : 0.839)

2022.05.27 18:05 2,420 조회 language

https://www.sbert.net/를 참고해 작성한 baseline 코드입니다.
데이터는 sample_train.csv만 사용해서 학습했습니다.
huggingface나 pytorch에 비해 살짝 더 추상화가 되어 있어, 코드를 이해하고 사용하기 쉬운 반면 다양한 커스터마이징은 힘들다는 점이 단점입니다.
predict 부분에서 버그(?)가 있는 것 같은데, 해결법을 아시는 분들은 공유해주시면 감사하겠습니다.

코드
로그인이 필요합니다
0 / 1000
___
2022.05.30 23:32

CrossEncoder 모델을 save했는데 다시 불러와서 사용하는 방법을 모르겠습니다. load는 어떤 함수로 할 수 있나요?

둘리
2022.05.30 23:51

loaded_model = CrossEncoder(저장된 모델 경로, num_labels=1)
로 하시면 됩니다.