분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제2회 Medical AI (MAI) 경진대회
간단하게 조언 받고 싶습니다
최종 발표에 참관하여 들었으면 좋았을 것 같은데 그러지 못해서
어떻게 문제를 해결해 나갔는지, 주요 전환점이 무엇이었는지 듣고 싶습니다.
간단하게 한 말씀이라도 해주시면 정말 감사하겠습니다!
바쁘신 와중에 댓글 남겨주셔서 정말 감사합니다 새겨듣고 공부해보겠습니다!
저렇게 적었지만 각 단계에 수십 시간이 소요된터라, 사실상 노가다 하면서 프루닝한 거에 가깝습니다. 다른 분들 아이디어 중에 재밌는 게 더 많았던 거 같네요. 평안한 연말 되세요.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요. 나중에 여유가 생기면 자세히 정리할 수 있도록 하겠습니다. 매우 단순화해서 설명하면 저희는 다음과 같이 진행하였습니다.
1. 토크나이저 차이로 nt2가 아니라 DNABERT2로 일단 베이스라인 실험 진행했습니다. 양쪽 맥락 볼 수 있게 돌연변이 전처리 적절히 시행착오해서 한 0.69까지 올랐습니다.
2. 게놈 인트론 서열 중에서 병원성 위험이 보고된 영역을 제거한 뒤, 돌연변이 무작위 증강을 하여 PCC 학습 loss 추가하였습니다. 한 0.73 이상으로 올랐던 걸로 기억합니다.
3. 벡본 모델을 evo2로 업그레이드해서 최고 성능 달성했습니다.