The 2nd Medical AI (MAI) Competition

Algorithm | Medical | Gene | Cosine Distance

  • moneyIcon 10,000,000 KRW
  • 815 Users Completed

 

GPN 기반 fine-tuning

2025.12.10 01:41 878 Views language

조악하지만 코드를 공유드립니다. 너그러이 봐주시면 감사하겠습니다.
대회를 우연히 알게 되었는데, 많은 것을 배우는 기회가 되었습니다. 감사합니다.
자세한 내용은 README.md를 참고해 주세요.
https://github.com/nistring/DNA-embedding

Code
Login Required
0 / 1000
code7monkey
2025.12.10 13:02

좋은 코드 감사합니다..! 덕분에 많이 배워갑니다. 
중간에 test데이터와 hamming거리 계산하는 부분이 있는데 이 부분  leakage 예방에만 쓰이는 걸까요? 아니면 다른 쓰임새가 있는 걸까요?

nistring
2025.12.10 13:19

Hamming distance 계산을 통해 test.csv의 내부 매칭을 추측하고 이를 이용해 말씀처럼 leakage 예방 및 내부 evaluation data 제작에 활용하였습니다.
내부 evaluation은 matched_pairs_labeled.csv로 하였으며, 이 생성 코드는 repo에 포함되어 있지 않으나 hamming distance pair을 이용해 간단히 만드실 수 있습니다.

code7monkey
2025.12.10 13:32

빠른 답변 감사합니다!

신동운
2025.12.10 23:32

공유해주셔서 감사합니다!!

신동운
2025.12.10 23:45

진짜 입문자로써 많은 걸 얻어가네요... 미쳤습니다. 감사합니다..