제2회 Medical AI (MAI) 경진대회

알고리즘 | 의료 | 유전자 | Cosine Distance

  • moneyIcon 상금 1,000만 원
  • 815명 마감

 

GPN 기반 fine-tuning

2025.12.10 01:41 877 조회 language

조악하지만 코드를 공유드립니다. 너그러이 봐주시면 감사하겠습니다.
대회를 우연히 알게 되었는데, 많은 것을 배우는 기회가 되었습니다. 감사합니다.
자세한 내용은 README.md를 참고해 주세요.
https://github.com/nistring/DNA-embedding

코드
로그인이 필요합니다
0 / 1000
code7monkey
2025.12.10 13:02

좋은 코드 감사합니다..! 덕분에 많이 배워갑니다. 
중간에 test데이터와 hamming거리 계산하는 부분이 있는데 이 부분  leakage 예방에만 쓰이는 걸까요? 아니면 다른 쓰임새가 있는 걸까요?

nistring
2025.12.10 13:19

Hamming distance 계산을 통해 test.csv의 내부 매칭을 추측하고 이를 이용해 말씀처럼 leakage 예방 및 내부 evaluation data 제작에 활용하였습니다.
내부 evaluation은 matched_pairs_labeled.csv로 하였으며, 이 생성 코드는 repo에 포함되어 있지 않으나 hamming distance pair을 이용해 간단히 만드실 수 있습니다.

code7monkey
2025.12.10 13:32

빠른 답변 감사합니다!

신동운
2025.12.10 23:32

공유해주셔서 감사합니다!!

신동운
2025.12.10 23:45

진짜 입문자로써 많은 걸 얻어가네요... 미쳤습니다. 감사합니다..