분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
GPN 기반 fine-tuning
조악하지만 코드를 공유드립니다. 너그러이 봐주시면 감사하겠습니다.
대회를 우연히 알게 되었는데, 많은 것을 배우는 기회가 되었습니다. 감사합니다.
자세한 내용은 README.md를 참고해 주세요.
https://github.com/nistring/DNA-embedding
Hamming distance 계산을 통해 test.csv의 내부 매칭을 추측하고 이를 이용해 말씀처럼 leakage 예방 및 내부 evaluation data 제작에 활용하였습니다.
내부 evaluation은 matched_pairs_labeled.csv로 하였으며, 이 생성 코드는 repo에 포함되어 있지 않으나 hamming distance pair을 이용해 간단히 만드실 수 있습니다.
빠른 답변 감사합니다!
공유해주셔서 감사합니다!!
진짜 입문자로써 많은 걸 얻어가네요... 미쳤습니다. 감사합니다..
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
좋은 코드 감사합니다..! 덕분에 많이 배워갑니다.
중간에 test데이터와 hamming거리 계산하는 부분이 있는데 이 부분 leakage 예방에만 쓰이는 걸까요? 아니면 다른 쓰임새가 있는 걸까요?