제2회 Medical AI (MAI) 경진대회

알고리즘 | 의료 | 유전자 | Cosine Distance

  • moneyIcon 상금 1,000만 원
  • 815명 마감

 

[public 0.55023] 코드 공유드립니다. [참고만 해주세요]

2025.11.19 14:00 2,337 조회 language

참가 제한 때문에 개인적으로 관심있는 분야라 잠시 찍먹만 했습니다.
파이팅 하세요 !

가상환경 새로 하나 파시는 걸 추천드립니다. 라이브러리 호환이 안되면 동작을 안해요 !

아래는 제 가상환경 입니다. 

Python==3.10.18
torch==2.6.0 
transformers==4.57.1
accelerate==1.11.0
CUDA 12.1

==================================================
Contrastive Learning 중 Domain Adaptation을 활용한 코드인데 규칙상 사용이 불가하다고 합니다 ㅜㅜ

코드
로그인이 필요합니다
0 / 1000
sungminzzang
2025.11.22 03:37

멋지십니다 감사합니다

KwCCCC
2025.11.26 20:41

코드 공유 감사합니다. 다름이 아니라 어떤 규칙에 위배되는건지 알 수 있을까요?

신약보단마약이지
2025.11.26 20:45

안녕하세요, 대회 측 의견으로는 
"test set은 어떠한 형태로든 학습에 사용이 불가능합니다. "
즉, test set으로 접근하는 것 자체가 허용이 안되는 것 같습니다.
제 코드는 Contrastive Learning 중 Domain Adaptation을 활용한 방법 중 하나로, test.csv를 최종적으로 학습에 사용하진 않았으나, 가짜 데이터 생성을 위해서 test.csv에 접근을 했기 때문에 규칙에 위배되는 것 같습니다.

KwCCCC
2025.11.26 21:20

답변 감사합니다. 정리해보자면 RobustModel 학습 시 test.csv와 test.csv를 변형해서 만든 가짜 데이터를 사용해서 규칙에 위배된 것 같다는 말씀이신가요?

신약보단마약이지
2025.11.27 00:14

네, 정확히 이해하셨습니다.
비록 정답Label을 학습에 사용한 건 아니지만, 학습 데이터를 생성하는 과정에서 test.csv의 Sequence 정보에 접근했기 때문에 
학습에 사용하지 않아도 일단 "test set에 접근 = 접근했으므로 데이터 리키지" 로 인식하는 것 같습니다.

KwCCCC
2025.11.27 00:15

친절한 답변 감사드립니다.

순데이터
2025.11.28 14:39

2.5b 모델같은걸로 모델바꿔서 사용하는건 어떻게 생각하시나요?!
라이브러리 새로 파라는게 코랩같은거 사용하라는건가욥?

신약보단마약이지
2025.11.28 17:05

2.5b 모델은 실험을 하지 않았는데, 해보시는 것도 좋을 것 같습니다.
라이브러리 설치는 기존의 가상환경을 가지고 계실텐데, 여기에 추가로 라이브러리를 설치할 경우 충돌로 에러가 날 수 있기 때문에
새로운 가상환경을 하나 파시고 라이브러리를 설치하는 것을 추천드린다는 의미입니다.