코드 유사성 판단 시즌2 AI 경진대회

알고리즘 | 월간 데이콘 | NLP | 유사도 | Accuracy

  • moneyIcon 상금 : 인증서
  • 319명 마감

 

train 데이터 생성 코드(미남호일룬님 코드 참고)

2024.03.23 01:26 407 조회 language

안녕하세요
왜인지 저는 미남호일룬님 코드에서 에러가 뜨길래
제 스타일로 하나 더 만들었습니다.
노트북에서 10000 샘플 생성하는데에 약 70초 걸렸습니다.

아래 세 변수를 조절 가능합니다
path = '.' # 현재 환경에 train_code 폴더가 있다면 '.'이면 되고, 아니라면 train_code 폴더의 바로 위 폴더까지의 경로
sample_count = 10000 # 만들고싶은 총 샘플 데이터 수
pair_proportion = 0.5 # similar=1인 샘플 비율

코드
로그인이 필요합니다
0 / 1000
미남호일룬
2024.03.23 14:05

혹시 제 코드에서 어떤 오류가 발생하셨나요?

kimgugu
2024.03.23 15:32

오류 분석을 안해봐서 정확하진 않지만 폴더 주소 문제였던거같아요. 학습 데이터를 코드와 다른 폴더에 두고 코딩하고 있던터라 path 변수 바꾸고 돌렸었습니다.