코드 유사성 판단 시즌2 AI 경진대회

알고리즘 | 월간 데이콘 | NLP | 유사도 | Accuracy

상금 : 인증서
332명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

[private 2위/0.99103]UniXcoder-clone-detection 모델 threshold조정

고세구

2024.04.01 17:31 679 조회 language

UniXcoder모델하고 Codesage모델 voting만 계속 하다가 UniXcoder 임계값 0.1로 바꿔봤더니 hard voting했을 때보다 0.001정도 성능이 올랐네요. 근데 0.1을 수기로 입력한거라 비정상적인 방법으로 얻은 건지 잘 모르겠네요.. 어쨌든 수고하셨습니다.

사용한 모델 링크입니다.
https://huggingface.co/Lazyhope/unixcoder-clone-detection

학습 때 사용했던 코드들 입니다.
https://github.com/be0k/code-similarity

PDF

코드

댓글 2개

로그인이 필요합니다

comment

0 / 1000

basslibrary

2024.04.02 10:55

사용하신 모델이 코드 검증에 파인튜닝된 모델인데,
논문등에서 발표되지 않고 개인이 튜닝한 모델로 보여서,
규정이 어떻게 적용될 지 모르겠네요.

고세구

2024.04.02 11:01

규칙)
사용에 법적 제한이 없으며 오픈 소스로 공개된 사전 학습된 모델(Pre-trained Model)만 사용 가능

해당 모델은 MIT license이고 open source로 공개된 모델이기 때문에 사용해도 상관없을 것 같습니다.
다른 파인튜닝된 모델(https://huggingface.co/nchen909/plbart-base-finetuned-clone-detection) 사용가능 여부를 dacon측에 메일로 문의 드려본 결과
사용에 법적 제한이 없는 license를 가지고 있고 오픈소스로 공개된 모델은 다 사용 가능한 것 같더라구요

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동하였습니다!

목록으로

[Private 4위/0.9849] codebert_cpp - codereviewer

대회 - 코드 유사성 판단 시즌2 AI 경진대회

4달 전

현재 글

[private 2위/0.99103]UniXcoder-clone-detection 모델 threshold조정

대회 - 코드 유사성 판단 시즌2 AI 경진대회

4달 전

[data pre-processing] Train 데이터 초고속 생성 코드

대회 - 코드 유사성 판단 시즌2 AI 경진대회

4달 전