분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제2회 AI 신약개발 경진대회
대회 후기 & 수상 소감 (팀명 : nabi / נָבִיא, )
처음 도전하는 대회였지만 팀원들과 함께한 소중한 여정 덕분에 가능했고, 이 모든 과정과 결과에 감사드립니다. 최선을 다해 준비했지만 이렇게 큰 성과를 거둘 줄은 몰랐습니다. 모든 영광을 하나님께 올려드리며, 함께해 주신 모든 분들께 진심으로 감사의 마음을 전합니다.
저희 팀 ‘나비’는 히브리어로 נָבִיא, 예언자라는 뜻을 담고 있습니다. 인공지능 기술을 활용해 예측(predict)하는 분야에서 새로운 가능성을 탐구하고자 이 이름을 정했습니다. 원래 교수님께서 AI와 생명과학을 전공하고 있는 학부생 스터디 그룹명으로 사용하려던 이름인데, 이번 대회도 IRAK4 억제제의 효능을 "예측"하는 것이니 이름을 제안하셨고 팀원 모두 좋아했습니다.
팀원들은 한동대학교 학부생 3명, 졸업생 1명, 그리고 교수님으로 이루어져 있습니다. 대회와 신약 개발 모두 처음 도전하는 분야였지만, 스크래치부터 시작하자는 열정과 도전 정신이 우리를 하나로 묶어 주었습니다.
대회를 준비하며 매주 월요일 교수님 연구실에 모여 중간 점검을 하고, 이후에는 자정을 넘겨 카톡방에서 아이디어를 주고받던 시간들이 기억에 남습니다. 신약개발 도메인 전문가가 없는 상황에서도 모두가 함께 성장하며 문제를 해결해 나갔습니다.
저희 팀은 단순히 대회를 준비한 것을 넘어, 서로의 열정과 배움을 나누며 한 단계 더 성장할 수 있었던 소중한 여정을 만들어갔습니다.
저희는 팀으로 출전했기 때문에, 팀원간의 긴밀한 협업도 있었지만, 대회 초반에는 알게 모르게? 의도된? 팀원간의 경쟁도 있었습니다 :-) 여러 머신러닝 모델들과 여러 데이터 전략들을 시도해보는 것이 저희 팀이 가지고 있던 하나의 목표였기 때문에, 각 팀원들이 서로 다른 모델과 다른 데이터 전략을 각자 시도해 보고 개인적으로 결과를 제출해서 Public Leaderboard 점수와 내부 평가 점수를 받았습니다. 이 점수가 경쟁팀과의 비교 척도도 되었지만, 저희 팀내의 다른 팀원들과의 점수와도 자연스럽게 비교가 되었기 때문에, 선의의 경쟁을 통한 동기부여도 되었고, 또한 여러 모델/데이터 중에 더 나은 것을 찾기 위한 좋은 방법도 되었고, 더 나아가 여러 모델이나 데이터들을 합쳐서 새로운 것을 만들어내는 Ensemble 기법 적용에도 도움이 되었던 것 같습니다.
특히, 팀원 모두가 chemistry domain의 전문가가 아니었기에 기존의 틀에 얽매이지 않고 참신한 접근법을 시도할 수 있었습니다. 무작정 다양한 방법과 연구를 탐구하며 수많은 조합을 만들고, 각자의 강점과 흥미를 바탕으로 실험을 분담한 것이 큰 도움이 되었습니다. 한 가지 방법에만 집중하기보다는 폭넓게 문제를 탐구하며 다양한 방법을 조합하고 도전한 점이 저희 팀의 독특한 전략이었다고 생각합니다.
개인적으로 실험과 분석을 진행하면서도, 빠지지 않고 정기적으로 모두 모여 방향성을 공유하고 조율하며, 서로의 새로운 시도를 소개하는 시간을 통해 함께 성장할 수 있었습니다. 다섯 명이 힘을 합쳐 많은 실험을 시도하고 이를 전략적으로 정리한 결과가 좋은 성과로 이어졌다고 생각합니다.
이번 성과의 비결은 팀원 모두의 열정과 협업, 그리고 전략적인 접근에 있다고 생각합니다. 다양한 시도를 분담하여 진행하면서 서로의 아이디어를 공유하고 발전시킨 점이 큰 시너지를 발휘했습니다. 특히 하나의 모델에서 도출된 좋은 결과를 기반으로 다른 모델에 적용하거나 데이터를 재활용하며 성능을 극대화한 점이 주효했습니다.
또한, ‘하면 좋을 것 같은데?’라는 작은 아이디어라도 바로 실행에 옮기고, 다수의 모델과 feature들을 효율적으로 조합하고 실험을 자동화하여 시간을 절약할 수 있었던 점도 중요했습니다.
무엇보다 끝까지 포기하지 않는 끈기와 팀원 개개인의 노력, 그리고 이를 하나로 모아 좋은 결과를 도출해 낸 팀워크가 이번 성과의 가장 큰 비결이라고 생각합니다.
대회 기간 동안 기억에 남는 순간들이 정말 많았습니다. 초반에 Public Leaderboard에서 10위권 안에 들어갔을 때 모두가 더 열심히 하자며 의지를 다졌습니다. 하지만 1차 제출 마감이 다가올수록 순위가 점점 뒤로 밀려 마지막에는 순위권 밖으로 완전히 벗어나기도 했습니다. Public Leaderboard 점수에 연연하지 않으려 노력하며 내부 평가 점수와 일반화를 고민했는데, 마감 후 Private Leaderboard 점수가 3등으로 나왔을 때는 정말 놀랐고, 행복했습니다. 그 순간이 특히 기억에 남습니다.
또한, 리더보드 점수가 높았던 코드가 reproducible하지 않다는 것을 깨달았을 때 충격이 컸습니다. 검증 코드에 아주 사소한 실수가 있었는데, 그 여파는 상대적으로 커서, 대회 중단을 결정했던 순간도 있었습니다. 하지만 이런 어려움을 극복하며 포스터 발표 버전을 9개나 만들 만큼 열정적으로 임했던 팀원들의 자세가 항상 큰 힘이 되었습니다.
대회 중간에는 ‘될 것 같은 것이 안 되고, 안 될 것 같았던 것이 되는’ 경험을 하며 겸손과 배움의 자세를 익힐 수 있었습니다. 특히, AI Pharma Korea Conference에서 수상자들의 이력을 보며 신약개발회사 종사자/연구자와 박사 과정 학생들 사이에서 학부생 위주의 팀으로 여기까지 온 것이 매우 감사하고 뿌듯했습니다. 컨퍼런스에서 노벨화학상 수상자인 David Baker 교수님의 연구실 팀원들의 강의를 들었던 것도 큰 영감을 준 순간이었습니다.
첫 모임에서 서로 누구인지 알고 있음에도 자기소개 발표 자료를 만들어 왔던 일부터, Private Score가 공개된 날의 감동, 그리고 수많은 도전과 사건 사고를 겪으며 배운 모든 시간이 기적 같았고, 한순간도 잊을 수 없는 특별한 여정이었습니다.
저희 팀의 노하우는 체계적인 실험 관리와 자동화, 그리고 협업의 중요성을 깨닫고 이를 실천한 데에 있었던 것 같습니다. 처음에는 Jupyter Lab과 같은 환경에서 빠르게 PoC(Proof of Concept)를 만들어 시도해보는 것이 일반적이지만, 실험이 많아질수록 관리가 어려워질 수 있습니다. 따라서 일정 수준의 아웃라인이 잡히면, 시간이 더 들더라도 실험을 자동화하고 결과를 체계적으로 관리할 수 있는 코드 형태로 전환하는 것이 중요하다고 생각합니다. 이는 데이터 사이언스에 필수적인 엔지니어링 능력이 요구되는 부분이라고 느꼈습니다.
또한, 처음부터 baseline 코드를 탄탄하게 만들어 놓고, 그 위에 차근차근 개선점을 더해가는 방식이 매우 유용했습니다. 처음에는 무작정 시도하다 보니 파일 관리와 데이터 정리에 혼란을 겪었지만, 이를 체계적으로 정리하며 더 나은 결과를 도출할 수 있었습니다.
무엇보다 협업이 큰 역할을 했습니다. 누군가와 함께 데이터를 분석하면 다양한 시각에서 접근할 수 있을 뿐 아니라, 어려운 상황에서도 끝까지 포기하지 않고 함께 달려갈 수 있는 힘이 생깁니다.
한국이 다른 분야에 비해 상대적으로 소프트웨어 부분이나 인공지능 부분에서 글로벌 경쟁력이 약하다는 이야기를 많이 듣습니다. 외국에서 만든 것을 가져다가 사용하는 것은 잘 하는데, 우리가 만들고 외국에서 우리 것을 가져다가 쓰는 경우가 드물어서 약하다고 하는 것 같은데, 동의하지 않을 수가 없어 안타깝습니다. 데이콘을 통해 정직하고 겸손하며 실력 있는 인재들이 많이 배출되기를 소망합니다. 저희의 작은 접근법과 도전이 누군가에게 통찰과 영감을 줄 수 있다면 정말 뜻 깊을 것 같습니다. 궁극적으로는 한국에서도 과학분야에서 노벨상을 수상할 날이 오길 꿈꿉니다.
인공지능 기술을 활용해 세상에 실제적인 가치를 만들어 내보고 싶습니다. 이번 대회를 통해 AI가 신약 개발과 같은 중요한 분야에서 가진 가능성을 확인할 수 있었고, 앞으로도 이러한 분야에서 혁신적인 연구를 이어가며 누군가의 삶에 도움이 되고 싶습니다.
또한, 데이콘에서 주최하는 대회에 다시 도전해보고 싶으며, 나아가 여러 기관들과 협력해 직접 대회를 주최해 보는 꿈도 가지고 있습니다. 다음 AI 신약 개발 경진대회가 열린다면 1등을 목표로 도전하고 싶습니다. 무엇보다 언제나 더 많은 꿈을 꾸고, 열정을 다하며 세상에 선한 영향력을 끼치는 사람이 되고자 노력하겠습니다.
이번 대회가 AI PHARMA KOREA CONFERENCE와 연결되어 있는 줄은 정말 몰랐습니다. 그런데, 너무 좋은 방식이었던 것 같습니다. 특히, 저희 팀과 같이 실무에 있지 않는 학부생 멤버들로 구성된 경우, 대회 내용만 가지고는 배울 수 없는 내용들을 마지막날 컨퍼런스를 통해서 굉장히 많이 접할 수 있게 되어서 정말 많은 도움이 되었던 것 같습니다. 이러한 형태의 대회가 앞으로도 많아지기를 기대하며, 특히 수상 팀들이 시도한 다양한 방법들을 배울 수 있는 세션이나 발표 시간을 조금 더 확대해 주시면 더욱 좋을 것 같습니다. 포스터 세션에 참여 시간이 제한되어 다른 팀의 연구를 충분히 살피지 못했던 점이 다소 아쉬웠습니다.
또한, 데이콘의 교육 프로그램이 머신러닝 기법 위주로 이루어져 있는데, 도메인 지식과 융합된 머신러닝 교육이 추가된다면 참가자들이 더 큰 시너지를 얻을 수 있을 것 같습니다. 대회 게시판에 더 많은 교류와 토론이 이루어질 수 있는 환경도 기대합니다.
하루 제출 기회가 3번으로 제한된 점은 다소 아쉬웠지만, 그럼에도 불구하고 이렇게 좋은 대회를 열어주셔서 정말 감사드립니다. 다음 AI 신약 개발 경진대회가 열린다면 또다시 참여하고 싶습니다. 수상자에게 학술대회나 컨퍼런스 참석 기회를 제공해 주신 점도 큰 동기부여가 되었기에, 앞으로도 이러한 기회가 계속 이어지길 바랍니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved