분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제2회 Medical AI (MAI) 경진대회
제2회 Medical AI (MAI) 경진대회 수상자 인터뷰 - TEAM <ti_esti>
축하합니다, TEAM ti_esti님! 수상의 영광을 함께 나누게 되어 기쁩니다. 
TEAM <ti_esti> : 김유환(ti_esti), 이민규(치즈김치피자), 이상민(확률이확산확산), 강종서(김지학), 홍석화(가나다가나다)
우승의 기쁨을 맛본 소감을 한마디로 표현해 주세요.
많이 부족하지만 우승하게 되어 기쁩니다. 재밌는 대회를 준비해주신 고려대학교 의과대학 연구실 선생님들과 데이콘 운영진분들께 진심으로 감사드립니다.
팀의 이야기를 들려주세요.
저희 팀 이름 ti_esti는 그리스어 τί ἐστι에서 가져왔고, 소크라테스식 변증법의 핵심 질문인 “그것은 무엇인가?”라는 의미를 담고 있습니다. 본질을 찾고 집중하자는 의미를 담아 팀명을 정했습니다. 작년에 다른 대회에서 유전체 데이터를 다룰 기회가 있었고, 그 경험을 계기로 이번 대회를 참가하게 되었습니다.
여러분을 돋보이게 한 특별한 점은 무엇인가요?
발표에 있어서는 최대한 선택이나 판단의 논리적인 근거를 설명하고자 노력하였습니다.
모델 성능 개선에 있어서는 PCC를 위한 인트론 데이터 증강이 도움이 된 것 같습니다.
이번 성과의 비결은 무엇이라고 생각하시나요?
발표 관련 내용은 위로 갈음하고 모델 성능에 국한하여 말씀드리면 PCC 지표 최적화에 있는 거 같습니다.
트리비얼한 말이지만 돌연변이가 많을수록 병적 변이일 확률이 높습니다. ClinVar(2025-11-09)에는 SNP를 포함하여 MNP, INDEL 데이터 등 다양한 변이 횟수를 포함합니다. 따라서 초기에는 CD/CCD를 학습하는 과정에서 PCC가 자동으로 최적화될 수 있을 것이라는 가설을 세웠습니다.
그러다가 초중반에 Backbone 모델 DNABERT2에서 evo2_7b로 교체한 적이 있었습니다. 저희가 평가한 valid metric(CD/CCD)로는 최고점을 기록하여 제출하였으나 제출 점수는 오히려 감소하였습니다. 저희는 이를 토대로 다음과 같이 판단하였습니다.
PCC 최적화를 위해 별도의 변이 증강 데이터를 만들되, ClinVar ref나 임의 genome 구간에 무작위 변이를 넣는 방식은 위험이 있다고 판단하였습니다. 상위성(epistasis) 또는 합성치사(synthetic lethality) 등으로 “그 변이가 병적/양적인지”를 판단할 근거가 없습니다. 그리고 "쓰레기에 쓰레기를 더해도 쓰레기다"라는 원칙 아래에 병원성 서열을 이용한 증강은 특정 패턴 과민을 유발할 수 있어 위험하다고 보았습니다. 그래서 비교적 위험을 낮추는 방향으로, 병원성 보고 intron 구간을 제외한 intron 기반의 ‘중립(ref) 서열’을 구성해 그 위에 변이를 주입하는 전략을 택했습니다.
증강은 작은 변이 구간은 로그 스케일로 촘촘히, 큰 변이는 균일 샘플링으로 커버하도록 설계했습니다. 이 데이터에는 분류 라벨을 붙이지 않고 PCC 학습 전용 로더로 분리해 CD/CCD 학습 로더와 한 batch에서 따로 학습되고 최종 loss에 반영되는 방식으로 최적화되었습니다. 그 결과 최고 성능에 도달했습니다.
대회 기간 중 특별히 기억에 남는 순간이 있다면 공유해 주세요.
두 순간이 가장 기억에 남습니다. 처음에 CD/CCD 학습 방식을 최적화해서 비약적인 성능 향상이 있었던 순간, 그리고 PCC 데이터를 증강하여 적용하였을 때 성능 향상이 있던 순간입니다.
데이터 분석이나 학습 과정에서의 나만의 비법이 있다면요?
문제를 추상화 한 다음에 빠르게 전체 파이프라인을 구성하고 고도화하는 방향이 좋은 것 같습니다.
수상을 기념하여 빌 수 있는 한 가지 소원이 있다면?
2025년이 많이 남지 않았는데 다들 연말을 행복하게 마무리 하셨으면 좋겠습니다.
앞으로의 목표와 꿈을 말씀해 주세요.
나중에도 생명 AI 대회가 열리면 열심히 참가하도록 하겠습니다.
데이콘 커뮤니티에 바라는 점이 있다면 무엇인가요?
다양한 대회가 자주 열릴 수 있으면 좋겠습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved