분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[private 5위 / 0.98479] graphcodebert + codebert-base-mlm 앙상블
공동작성자
안녕하세요. Private 5등 팀입니다.
처음 대회에 참여해 운 좋게 상을 받은 거 같아 영광이고, 지난 시즌 1의 코드 공유 파일을 많이 참고하여 좋은 성적을 낼 수 있었습니다.
전체 코드 틀은 지난 대회의 Gmin47님, 데이터 샘플링은 지난대회의 나일강님의 코드를 베이스로 사용하여 작성하였습니다.
저희는 neulab/codebert-cpp와 microsoft/graphcodebert-base 두 모델을 각각 180만 행의 데이터를 사용해 파인튜닝하였고, 앙상블 해 최종 Score를 제출했습니다.
개발환경: Colab A100
transformers==4.38.2
torch==2.2.1+cu121
scikit-learn==1.2.2
라이브러리 및 자세한 실행 환경은 Github 안에 첨부하였습니다.
Github:
https://github.com/chahanyeong/cpp-code-similarity
Model:
https://huggingface.co/microsoft/graphcodebert-base/tree/main
https://huggingface.co/microsoft/codebert-base-mlm/tree/main
다들 대회 수고 많으셨습니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved