월간 데이콘 코드 유사성 판단 AI 경진대회

알고리즘 | NLP | 분류 | 유사성 | Accuracy

  • moneyIcon 상금 : 총 600만 원
  • 892명 마감

 

커스터마이징 가능한 베이스라인(Pytorch) (0.9105)

2022.05.27 17:56 2,479 조회 language

베이스라인을 커스터마이징 가능하도록 만들었습니다
텍스트 전처리, 모델 설정 혹은 바꿀 수 있도록 만들었으며 전체적으로 쉽게 만들 수 있도록 수정하였습니다.

학습 과정 또한 trainer 에서 수정하였으며 더 다양한 것을 시도할 수 있습니다.

수정: submission 결과 0.9105 입니다

코드
로그인이 필요합니다
0 / 1000
AI_JH
2022.05.29 05:45

정말 감사합니다.
질문이 하나 있는데요. 
기존 baseline과 같이 submission에서 testdata 이후 pred하는 과정이 궁금합니다.

amity1081
2022.05.29 23:26

저는 테스트 데이터가 워낙 크다 보니까 나눠서 데이터 셋을 만들어서 예측을 했는데
학습 과정에서 한 것과 사실 다를 바가 없습니다.
테스트 데이터 300개씩 데이터 로더를 만들어서 배치 사이즈 1개로 만들어 예측을 시켰습니다.