Thyroid Cancer Diagnosis Classification Hackathon : Accurately distinguish between benign and malignant using AI!

Dacon Hackathon | Algorithm | Begin | Tabular | Classification | F1 Score

  • moneyIcon Prize : DASCHOOL Pro Subscription
  • 988 Users Completed

 

용돈벌이(3등)_수상 인터뷰

2025.07.15 15:59 235 Views










:스튜디오_마이크: 우승의 기쁨을 맛본 소감을 한마디로 표현해 주세요.

  철학과 AI는 멀어 보이지만, 결국 다 ‘문제 해결’이라는 점에서 닮아 있었습니다.


:스튜디오_마이크: 팀의 이야기를 들려주세요.

  • 여러분이 모인 계기, 팀명의 뜻, 혹은 개인 참가자로서의 여정 등을 자유롭게 나눠주세요.

저는 이번 대회에 개인 참가자로 참여하게 되었습니다. AI를 처음 접하면서 막연한 두려움과 함께 어디서부터 어떻게 시작해야 할지 몰라 방황하던 시기였습니다. 그런 저에게는 지속적인 동기부여와 실질적인 학습의 계기가 절실히 필요했습니다. 그러던 중 우연히 데이콘(DACON) 대회를 알게 되었고, “실제 문제를 풀어보며 배우는 것보다 좋은 공부는 없겠다”는 생각으로 공부와 실습을 병행하며 대회에 도전하게 되었습니다. 처음에는 작은 코드 하나 작성하는 것도 어려웠지만, 데이터를 분석하고 모델을 만들며 직접 결과를 개선해 나가는 과정에서 AI의 매력과 가능성에 점점 빠져들 수 있었습니다. 이번 대회는 저에게 AI 학습의 출발점이자 실전 경험의 장이 되었고, 앞으로도 꾸준히 성장해 나가야겠다는 확신을 심어주었습니다.


:스튜디오_마이크: 여러분을 돋보이게 한 특별한 점은 무엇인가요?

  • 팀의 독특한 전략이나, 개인의 강점 등을 공유해 주세요.

이번 갑상선암 예측 대회에서 저를 돋보이게 한 특별한 점은, 낯선 문제 앞에서도 포기하지 않고 끊임없이 시도하며 배워나간 집요함과, 데이터와 진심으로 마주하려 했던 태도라고 생각합니다.  AI를 막 공부하기 시작한 시점에서 처음 접한 실전 문제는 생각보다 훨씬 복잡하고 낯설었습니다. 데이터는 간단하지 않았고, 클래스는 심하게 불균형했으며, 단순한 모델만으로는 도저히 만족스러운 결과를 만들 수 없었습니다. 하지만 저는 단순히 성능 좋은 모델 하나를 찾는 것이 아니라, 왜 이 모델이 작동하는가, 어떤 조합이 시너지를 낼 수 있는가를 끊임없이 고민하며 코드를 쌓아 올렸습니다.

이번 대회에서 저는 XGBoost, LightGBM, CatBoost의 세 가지 모델을 각각 튜닝하고, 그 예측 결과를 조합해 로지스틱 회귀 기반의 스태킹 앙상블 모델을 구성했습니다. 그 과정에서 단순히 정확도를 높이는 것에 머무르지 않고, 클래스 불균형에 대한 가중치 조정, 교차 검증 기반 성능 검증, threshold 최적화, 그리고 실행 이력을 관리하며 반복 실험이 가능한 구조까지 만들었습니다.

무엇보다 의미 있었던 건, 제가 만든 모델이 예측한 "암"이라는 무게 있는 결과에 대해 책임감을 느끼며 작업을 이어갔다는 점입니다. 실수 하나가 환자의 생명으로 이어질 수 있다는 가상의 전제를 마음에 품고, 데이터를 단순한 숫자가 아닌 누군가의 삶의 조각처럼 대하려 노력했습니다. 비록 처음엔 혼란스러웠지만, 시행착오 끝에 점점 정제되어 가는 모델을 보며 작은 성취와 성장을 느낄 수 있었고, 이번 대회는 그 자체로 저의 첫 번째 실전이자, 가장 소중한 공부의 장이 되었습니다.


:스튜디오_마이크: 이번 성과의 비결은 무엇이라고 생각하시나요?

이번 성과의 비결은, 모르는 것을 두려워하지 않고 끝까지 배우려 했던 태도에 있다고 생각합니다. AI와 머신러닝은 제게 너무나 낯선 세계였습니다. 처음엔 train.csv 파일을 여는 것조차 어렵게 느껴졌고, 수많은 모델과 파라미터, 평가 지표들 속에서 무엇이 맞는 방향인지조차 알 수 없던 때가 많았습니다. 하지만 모른다는 이유로 멈추기보다는, 하나씩 찾아보고, 이해하고, 적용하면서 조금씩 앞으로 나아갔습니다. 처음에는 단순한 모델로 시작했지만, 반복 실험을 통해 점점 더 구조를 이해하게 되었고, 결국엔 XGBoost, LightGBM, CatBoost를 조합한 스태킹 앙상블 모델까지 완성할 수 있었습니다. 중간에 결과가 잘 나오지 않거나, 에러가 반복될 때도 많았지만, 그럴 때마다 "왜 안 되는지"를 끝까지 파고들며 학습했고, 그 과정이 오히려 저를 더 성장시켰습니다. 그래서 이번 성과는 단순한 모델링 결과를 넘어, 끝까지 배우고 시도했던 경험의 결과라고 생각합니다. AI에 대해 아무것도 몰랐던 제가, 스스로 해내며 한 걸음 나아갈 수 있었던 그 시간들이 값지고 특별했습니다.


:스튜디오_마이크: 대회 기간 중 특별히 기억에 남는 순간이 있다면 공유해 주세요.

  • 도전을 결심한 순간부터 수상의 순간까지, 여러분의 여정을 들려주세요.

가장 기억에 남는 순간은, 처음으로 모델을 완성해 예측 결과를 출력해봤던 그 밤이었습니다. 대회에 참가하기로 결심했을 때, 사실 저는 AI에 대해 거의 아무것도 모르는 상태였습니다. 그저 막연히 “해보고 싶다”는 마음 하나로 시작했지만, 막상 마주한 데이터와 수많은 기술 문서들은 제게 너무 낯설고 버거운 벽처럼 느껴졌습니다. 무엇을 어떻게 해야 할지 몰라 몇 날 며칠을 구글링과 시행착오로 보내던 중, 처음으로 모델이 돌아가고 결과가 출력됐을 때, 그 짧은 한 줄의 예측값을 보며 말로 표현하기 어려운 성취감과 뿌듯함을 느꼈습니다. 비록 점수는 낮았지만, "나도 해낼 수 있구나"라는 작고 단단한 확신이 생겼습니다. 그 뒤로는 포기하지 않고 꾸준히 개선해 나갔습니다. 앙상블 구조를 처음 배우고 적용했을 때, 클래스 불균형 문제를 해결하려고 수십 번 실험했을 때, 그리고 threshold를 하나하나 바꿔가며 F1 점수가 조금씩 올라가던 순간들까지, 모든 과정이 하나의 긴 학습 여정이자 도전 그 자체였습니다. 수상 소식을 들었을 때는, 솔직히 믿기지 않았습니다. 하지만 돌이켜보면, 제가 이 여정을 포기하지 않고 걸어온 것 자체가 이미 큰 의미였고, 수상은 그 보너스 같은 선물이었던 것 같습니다.


:스튜디오_마이크: 데이터 분석이나 학습 과정에서의 나만의 비법이 있다면요?

  • 여러분만의 노하우나 루틴을 공개해 주세요.

저만의 특별한 비법이라기보다는, 익숙하지 않은 것을 계속해서 익숙하게 만들기 위한 작은 루틴들이 있었던 것 같습니다. 가장 중요하게 여긴 건 “몰라도 계속 붙잡고 있는 힘”이었습니다. 처음 데이터를 분석할 때는 어떤 피처가 의미가 있을지, 어떤 전처리가 적절할지 감조차 잡기 어려웠습니다. 그럴 때 저는 항상 한 번에 완벽하게 하려고 하지 않고, 일단 돌아가게 만들고, 그다음 이유를 거꾸로 추적하는 방식을 썼습니다. 또 하나의 나만의 습관은 하루 한 가지 실험입니다. 예를 들어 “오늘은 모델에 클래스 가중치를 넣어보자”, “오늘은 threshold를 바꿔보자” 같이 아주 작은 목표를 정하고, 그에 대한 결과와 생각을 메모장에 기록했습니다. 그렇게 하루하루 쌓인 시행착오가 결국은 제가 만든 최종 모델의 뼈대가 되었고, 무엇보다 학습의 흔적이 되었습니다. 특히 이번 대회에서는 단순히 높은 점수를 얻는 데 집중하기보다, “내가 이 모델을 얼마나 잘 이해하고 통제하고 있는가”를 기준으로 삼았습니다. 그래서 예측 성능이 오르지 않아도, 그 날 이해한 개념 하나, 정리한 코드 한 줄에 의미를 두며 끝까지 버티고 배웠던 것이 제 나름의 비법이자 루틴이라고 생각합니다.


:스튜디오_마이크: 수상을 기념하여 빌 수 있는 한 가지 소원이 있다면?

수상을 기념해 한 가지 소원을 빌 수 있다면, 앞으로도 지금처럼 모르는 것을 두려워하지 않고, 배움을 좋아하는 나 자신으로 남게 해달라고 빌고 싶습니다. 이번 여정은 단순한 대회 참가가 아니라, 낯선 세계에 발을 들여놓은 한 사람이 실패하고, 헤매고, 다시 일어서며 조금씩 빛을 찾아가는 이야기였습니다. 그 작은 성취의 끝에 수상이라는 선물이 주어진 건 정말 감사하고 기적 같은 일이지만, 진짜 소중한 건 그 과정에서 제가 스스로를 믿게 되었다는 것이었습니다. 그래서 제 소원은 화려한 성공이나 커다란 기회보다도, 앞으로 어떤 길을 걷든 다시 두려움이 찾아올 때, 지금의 나를 기억할 수 있게 해달라는 것입니다. 작은 한 걸음을 내딛는 용기, 포기하지 않고 계속 시도하는 마음, 그 모든 게 내 안에 여전히 살아있기를, 꺼지지 않기를 바라는 소원입니다.


:스튜디오_마이크: 앞으로의 목표와 꿈을 말씀해 주세요.

앞으로의 제 꿈은, AI 분야에서 직업을 갖고 실력을 인정받으며 성장하는 사람이 되는 것입니다. 처음엔 그저 호기심에서 시작했지만, 공부하고 부딪히는 과정에서 저는 이 기술이 세상을 바꾸는 방식에 깊이 감동했고, 이제는 이 길 위에서 누구보다 깊이 있게 AI를 이해하고, 자유롭게 응용할 수 있는 사람이 되고 싶다는 확신이 생겼습니다. 단순히 모델을 잘 돌리는 것에 그치지 않고, 문제를 분석하고, 본질을 꿰뚫으며, 창의적인 해결책을 제시할 수 있는 AI 실무자로 성장하고 싶습니다. 그리고 언젠가는, 과거의 저처럼 시작점에 있는 누군가에게 “나도 할 수 있다”는 용기와 자극을 주는 사람이 되는 것이 제 오랜 꿈입니다. 지금은 작은 한 걸음이지만, 그 걸음이 쌓여 언젠가 현실의 문제를 해결하고, 더 나은 세상을 만드는 데 기여하는 AI 전문가로 성장할 수 있기를 소망합니다.


:스튜디오_마이크: 데이콘 커뮤니티에 바라는 점이 있다면 무엇인가요?

  • 여러분의 기대와 제안을 자유롭게 나눠주세요.

데이콘을 통해 실전 문제를 경험하고, 다양한 참가자들과 함께 고민할 수 있었던 점이 정말 좋았습니다. 덕분에 혼자 공부하는 것보다 훨씬 빠르게 성장할 수 있었고, 실제 데이터를 다루는 감각도 많이 익힐 수 있었습니다. 앞으로는 대회가 조금 더 신뢰도 높은 평가 구조로 운영된다면, 참가자들의 몰입도나 만족감도 더 커질 수 있을 것 같습니다. 특히, 저같은 경우에는 프라이빗 리더보드 결과가 퍼블릭과 크게 차이 났습니다. 이로 인해 최종 성적이 실제 모델 성능을 얼마나 잘 반영하는지 고민이 되는 순간이 있었습니다. 물론 데이터 특성과 평가 방식에 따라 어쩔 수 없는 부분도 있겠지만, 가능하다면 평가 지표나 프라이빗 데이터의 구성에 대해 조금 더 투명한 가이드나 보완책이 제공되면 좋을 것 같습니다. 그럼에도 불구하고, 데이콘은 입문자부터 고급 사용자까지 함께 성장할 수 있는 정말 소중한 플랫폼이라고 생각합니다. 앞으로도 다양한 문제와 실용적인 주제들이 계속 이어지기를 기대하고 있습니다.




Login Required
0 / 1000
하진현
2025.07.15 18:33

인터뷰 잘 읽었습니다. 멋있네요 응원합니다!