분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제 4회 ETRI 휴먼이해 인공지능 논문경진대회 수상자 인터뷰 : 단머스
단머스 (단기머신러닝스터디)

축하합니다, 단머스 님! 수상의 영광을 함께 나누게 되어 기쁩니다. 
우승의 기쁨을 맛본 소감을 한마디로 표현해 주세요.
오랜 시간의 노력과 시행착오가 결실을 맺은 순간이었습니다.
결과도 물론 기쁘지만, 그 과정 속에서 많이 배우고 성장할 수 있었던 점이 더욱 뜻깊습니다.
팀의 이야기를 들려주세요.
‘단머스’는 **‘단기 머신러닝 스터디’**의 줄임말입니다.
경진대회를 함께 참여하며 다양한 데이터를 분석하고 경험하기 위해 스터디 형태로 운영되고 있습니다.
이번이 벌써 여덟 번째 모임인데요, 그동안 상위권에 오른 적은 있었지만 수상은 이번이 처음이라 더욱 감격스럽습니다. 😊
여러분을 돋보이게 한 특별한 점은 무엇인가요?
저희 팀은 데이터 전처리 단계에 가장 많은 시간과 노력을 투자했습니다.
수면의 품질을 예측하기 위해서는 기상 시간, 취침 시간, 수면 시간 등이 핵심 요소라고 판단했지만,
주어진 센서 데이터만으로 이를 정확히 추정하기에는 여러 제약이 있었고 결측치도 많았습니다.
이 문제를 해결하기 위해 **LLM**에게 다양한 맥락 정보를 제공하고,
그 상황에 맞게 결측치를 추정하도록 하는 아이디어를 발전시켰습니다.
이 접근이 좋은 성과로 이어져 결국 수상까지 할 수 있었습니다.
이번 성과의 비결은 무엇이라고 생각하시나요?
데이터의 크기가 작아 검증이 쉽지 않았던 점이 가장 큰 도전이었습니다.
이를 보완하기 위해 두 가지 형태의 검증셋을 별도로 구성했고,
이 검증 결과가 실제 퍼블릭 리더보드와 유사하게 나타나면서
다양한 실험을 안정적으로 반복할 수 있었습니다.
검증 설계의 정교함이 좋은 결과의 핵심 비결이었다고 생각합니다.
대회 기간 중 특별히 기억에 남는 순간이 있다면 공유해 주세요.
대회가 중간에 여러 번 연장되면서 솔직히 포기하고 싶은 순간도 있었습니다.
그런데 팀원 모두 끝까지 함께 해주었고, 그 덕분에 완주할 수 있었습니다.
결국 그 끈기가 좋은 결과로 이어졌다는 점이 가장 기억에 남습니다.
데이터 분석이나 학습 과정에서의 나만의 비법이 있다면요?
데이터 분석에는 여러가지 단계가 있는데, 그 중에서 가장 중요한 단계는 "데이터 이해를 위한 탐색" 단계라고 생각을 합니다.
충분한 탐색과 가설 수립 없이 모델링을 시작하면 방향을 잃기 쉽습니다.
저는 항상 데이터를 깊이 이해하고,
그 안에서 의미 있는 패턴과 가설을 찾아내는 데 시간을 가장 많이 투자합니다.
수상을 기념하여 빌 수 있는 한 가지 소원이 있다면?
이 경험이 더 많은 사람들에게 도전의 계기가 되길 바랍니다.
“데이터로 문제를 푸는 재미”를 함께 느꼈으면 좋겠습니다.
앞으로의 목표와 꿈을 말씀해 주세요.
이번에는 우수상을 받았지만, 다음 대회에서는 꼭 대상에 도전해보고 싶습니다!
그리고 앞으로도 꾸준히 배우고 성장하면서,
데이터를 통해 사람들에게 가치 있는 인사이트를 전달하는 분석가로 발전해나가고 싶습니다. 😊
데이콘 커뮤니티에 바라는 점이 있다면 무엇인가요?
다양한 도메인의 문제를 더 자주 다룰 수 있으면 좋겠습니다.
참가자들이 서로의 접근 방식을 공유하고 배우는 장이 계속 이어지길 바랍니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved