코드 유사성 판단 시즌2 AI 경진대회

알고리즘 | 월간 데이콘 | NLP | 유사도 | Accuracy

  • moneyIcon 상금 : 인증서
  • 329명 마감

 

[private 2위/0.99103]UniXcoder-clone-detection 모델 threshold조정

2024.04.01 17:31 665 조회 language

UniXcoder모델하고 Codesage모델 voting만 계속 하다가 UniXcoder 임계값 0.1로 바꿔봤더니 hard voting했을 때보다 0.001정도 성능이 올랐네요. 근데 0.1을 수기로 입력한거라 비정상적인 방법으로 얻은 건지 잘 모르겠네요.. 어쨌든 수고하셨습니다.

사용한 모델 링크입니다.
https://huggingface.co/Lazyhope/unixcoder-clone-detection

학습 때 사용했던 코드들 입니다.
https://github.com/be0k/code-similarity

PDF
코드
로그인이 필요합니다
0 / 1000
basslibrary
2024.04.02 10:55

사용하신 모델이 코드 검증에 파인튜닝된 모델인데,
논문등에서 발표되지 않고 개인이 튜닝한 모델로 보여서,
규정이 어떻게 적용될 지 모르겠네요.

고세구
2024.04.02 11:01

규칙)
사용에 법적 제한이 없으며 오픈 소스로 공개된 사전 학습된 모델(Pre-trained Model)만 사용 가능

해당 모델은 MIT license이고 open source로 공개된 모델이기 때문에 사용해도 상관없을 것 같습니다. 
다른 파인튜닝된 모델(https://huggingface.co/nchen909/plbart-base-finetuned-clone-detection) 사용가능 여부를 dacon측에 메일로 문의 드려본 결과
사용에 법적 제한이 없는 license를 가지고 있고 오픈소스로 공개된 모델은 다 사용 가능한 것 같더라구요