분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[public 0.55023] 코드 공유드립니다. [참고만 해주세요]
참가 제한 때문에 개인적으로 관심있는 분야라 잠시 찍먹만 했습니다.
파이팅 하세요 !
가상환경 새로 하나 파시는 걸 추천드립니다. 라이브러리 호환이 안되면 동작을 안해요 !
아래는 제 가상환경 입니다.
Python==3.10.18
torch==2.6.0
transformers==4.57.1
accelerate==1.11.0
CUDA 12.1
==================================================
Contrastive Learning 중 Domain Adaptation을 활용한 코드인데 규칙상 사용이 불가하다고 합니다 ㅜㅜ
코드 공유 감사합니다. 다름이 아니라 어떤 규칙에 위배되는건지 알 수 있을까요?
안녕하세요, 대회 측 의견으로는
"test set은 어떠한 형태로든 학습에 사용이 불가능합니다. "
즉, test set으로 접근하는 것 자체가 허용이 안되는 것 같습니다.
제 코드는 Contrastive Learning 중 Domain Adaptation을 활용한 방법 중 하나로, test.csv를 최종적으로 학습에 사용하진 않았으나, 가짜 데이터 생성을 위해서 test.csv에 접근을 했기 때문에 규칙에 위배되는 것 같습니다.
답변 감사합니다. 정리해보자면 RobustModel 학습 시 test.csv와 test.csv를 변형해서 만든 가짜 데이터를 사용해서 규칙에 위배된 것 같다는 말씀이신가요?
네, 정확히 이해하셨습니다.
비록 정답Label을 학습에 사용한 건 아니지만, 학습 데이터를 생성하는 과정에서 test.csv의 Sequence 정보에 접근했기 때문에
학습에 사용하지 않아도 일단 "test set에 접근 = 접근했으므로 데이터 리키지" 로 인식하는 것 같습니다.
친절한 답변 감사드립니다.
2.5b 모델같은걸로 모델바꿔서 사용하는건 어떻게 생각하시나요?!
라이브러리 새로 파라는게 코랩같은거 사용하라는건가욥?
2.5b 모델은 실험을 하지 않았는데, 해보시는 것도 좋을 것 같습니다.
라이브러리 설치는 기존의 가상환경을 가지고 계실텐데, 여기에 추가로 라이브러리를 설치할 경우 충돌로 에러가 날 수 있기 때문에
새로운 가상환경을 하나 파시고 라이브러리를 설치하는 것을 추천드린다는 의미입니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
멋지십니다 감사합니다