겨울맞이 대박할인
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제2회 Medical AI (MAI) 경진대회
간단하게 조언 받고 싶습니다
최종 발표에 참관하여 들었으면 좋았을 것 같은데 그러지 못해서
어떻게 문제를 해결해 나갔는지, 주요 전환점이 무엇이었는지 듣고 싶습니다.
간단하게 한 말씀이라도 해주시면 정말 감사하겠습니다!
바쁘신 와중에 댓글 남겨주셔서 정말 감사합니다 새겨듣고 공부해보겠습니다!
저렇게 적었지만 각 단계에 수십 시간이 소요된터라, 사실상 노가다 하면서 프루닝한 거에 가깝습니다. 다른 분들 아이디어 중에 재밌는 게 더 많았던 거 같네요. 평안한 연말 되세요.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요. 나중에 여유가 생기면 자세히 정리할 수 있도록 하겠습니다. 매우 단순화해서 설명하면 저희는 다음과 같이 진행하였습니다.
1. 토크나이저 차이로 nt2가 아니라 DNABERT2로 일단 베이스라인 실험 진행했습니다. 양쪽 맥락 볼 수 있게 돌연변이 전처리 적절히 시행착오해서 한 0.69까지 올랐습니다.
2. 게놈 인트론 서열 중에서 병원성 위험이 보고된 영역을 제거한 뒤, 돌연변이 무작위 증강을 하여 PCC 학습 loss 추가하였습니다. 한 0.73 이상으로 올랐던 걸로 기억합니다.
3. 벡본 모델을 evo2로 업그레이드해서 최고 성능 달성했습니다.