2025 Samsung AI Challenge : AIMSE 팀 인터뷰

Visually-rich Document Understanding : 2025 Samsung AI Challenge

ahavaujun

2025.10.01 10:50 803 조회

본인을 대표하는 이미지 한 장을 첨부해 주세요.

우승의 기쁨을 맛본 소감을 한마디로 표현해 주세요.

저희팀이 가장 좋아하는 분야에서 유의미한 성과를 얻었기에 굉장히 자랑스럽습니다!

팀의 이야기를 들려주세요.

저희팀은 고등학교 때부터 친구이자 대학교 동기 2명이 모인 팀으로써 결속력이 끈끈한 팀이었습니다. 저희는 신소재공학과로써 AI와 신소재공학을 결합한 대회에 참가한 것을 시작으로 AI + MSE(신소재공학) 팀이 시작되었습니다.

여러분을 돋보이게 한 특별한 점은 무엇인가요?

저희팀은 주어진 과제를 해결하기 위해 가장 먼저 VLM을 생각하였습니다. 저희팀 특유의 깊은 탐색 능력을 통해 task에 어울리는 모델들을 찾을 수 있었고, 이후 OCR과 VLM을 결합한 2-stage로 확장해나가며 성능을 높이는 것을 우선적으로 해결하려 하였던 것이 특별했던 점인 거 같습니다.

이번 성과의 비결은 무엇이라고 생각하시나요?

컴퓨터비전에 대한 근본적인 이해를 하려고 했던 것이 비결이라고 생각합니다. 주어진 task는 어떤 컴퓨터비전 영역에 해당하여 어떤 모델이 필요할 지, 모델이 뱉는 결과에 대한 confidence는 어떻게 구성할 수 있는지, submission 되어야 하는 형태와 평가지표는 어떤 지 근본적으로 이해하고 풀어보려 했던 점이 이번에 잘 맞아 떨어졌던 거 같습니다.

대회 기간 중 특별히 기억에 남는 순간이 있다면 공유해 주세요.

모델 구조를 one-stage에서 two-stage로 크게 전환했을 때가 가장 기억에 남습니다. 논의를 거쳐 성능이 개선될 거라 기대하며 예시 데이터로 먼저 실험해봤는데, 기대보다도 체감 성능이 확연히 향상되었습니다. 특히 리더보드 추론 결과에서 성능이 거의 70% 향상된 것을 확인했을 때 가장 짜릿한 순간이었습니다.

데이터 분석이나 학습 과정에서의 나만의 비법이 있다면요?

제가 모르는 분야의 데이터를 학습해야 할 때가 많습니다. 이럴 때는 무엇보다 데이터를 직관적으로 이해하는 데 집중합니다. 직접 EDA를 진행하기도 하고, 기존에 수행된 연구나 공개된 노트북들을 참고하면서 전체적인 감을 잡습니다. 그렇게 데이터를 이해하다 보면 어떤 학습 방법이 필요할지 자연스럽게 아이디어가 연쇄적으로 떠오르고, 그 과정에서 새로운 기법을 직관적으로 이해한 뒤 다시 필요한 기술을 공부하는 반복 학습 사이클을 만들어가는 편입니다.

수상을 기념하여 빌 수 있는 한 가지 소원이 있다면?