월간 데이콘 코드 유사성 판단 AI 경진대회

알고리즘 | NLP | 분류 | 유사성 | Accuracy

  • moneyIcon 상금 : 총 600만 원
  • 908명 마감

 

[Private 2nd, 0.9837], Part 1 of 2, Summary, Data creation

2022.06.16 21:18 1,966 조회 language

2nd place solution, Part 1 of 2

코드
로그인이 필요합니다
0 / 1000
snoop2head
2022.06.16 22:45

May I ask are there any additional dataset that you have utilized? Our team trained more than 900K for each folds, but failed to attain such performance with the same PLM 😂

vecxoz
2022.06.17 00:05

I did not use any additional data. One possible reason is different data cleaning.

snoop2head
2022.06.17 00:08

Did converting Python2 to Python3 code boost the classification performance? Haven't tested that one yet!

vecxoz
2022.06.17 00:18

I haven't tested it specifically, but I think it doesn't make much of a difference.

snoop2head
2022.06.17 00:26

Thank you for the answer 🤗

vecxoz
2022.06.17 00:35

You're welcome. Congrats on a high spot in the leaderboard.