Dacon Monthly Code Similarity Comparision AI Competition

Algorithm | NLP | Classification | Similarity | Accuracy

6,000,000 KRW
925 Users Completed

Practice

Overview Data Code (share) Talk Leaderboard

Submission

[Private 24th / 0.96665] Random Sampling + Graphcodebert

비회원

2022.06.10 23:23 3,786 Views language

좋은 대회 열어주셔서 감사드립니다.

참조 코드로는 '청소'님, 'arethusa'님의 코드를 참조하였습니다. 공유 감사드립니다.
코드 파일을 데이터로 만드는 과정에서 pair를 구성할 때 무작위적인 데이터 생성이 전체 데이터의 특성을 반영할 수 있다고 생각하여 특정 비율로 Random sampling을 진행했습니다. (구체적인 과정은 마크다운으로 적어놓았습니다.)
모델로는 Microsoft graphcodebert를 사용하였고 fold ensemble을 진행했습니다. 더 많은 시도를 해보지 못해서 아쉬움이 남네요. 단순 공유 목적으로 공유합니다!

감사합니다.

Code