분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[private 5위 / 0.98479] graphcodebert + codebert-base-mlm 앙상블
안녕하세요. Private 5등 팀입니다.
처음 대회에 참여해 운 좋게 상을 받은 거 같아 영광이고, 지난 시즌 1의 코드 공유 파일을 많이 참고하여 좋은 성적을 낼 수 있었습니다.
전체 코드 틀은 지난 대회의 Gmin47님, 데이터 샘플링은 지난대회의 나일강님의 코드를 베이스로 사용하여 작성하였습니다.
저희는 neulab/codebert-cpp와 microsoft/graphcodebert-base 두 모델을 각각 180만 행의 데이터를 사용해 파인튜닝하였고, 앙상블 해 최종 Score를 제출했습니다.
개발환경: Colab A100
transformers==4.38.2
torch==2.2.1+cu121
scikit-learn==1.2.2
라이브러리 및 자세한 실행 환경은 Github 안에 첨부하였습니다.
Github:
https://github.com/chahanyeong/cpp-code-similarity
Model:
https://huggingface.co/microsoft/graphcodebert-base/tree/main
https://huggingface.co/microsoft/codebert-base-mlm/tree/main
다들 대회 수고 많으셨습니다!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved