Visually-rich Document Understanding : 2025 Samsung AI Challenge

2025 Samsung AI Challenge : AIMSE 팀 인터뷰

2025.10.01 10:50 260 조회

:플래시가_깜박이는_카메라:

본인을 대표하는 이미지 한 장을 첨부해 주세요.

:스튜디오_마이크:

우승의 기쁨을 맛본 소감을 한마디로 표현해 주세요.

저희팀이 가장 좋아하는 분야에서 유의미한 성과를 얻었기에 굉장히 자랑스럽습니다!

:스튜디오_마이크:

팀의 이야기를 들려주세요.

저희팀은 고등학교 때부터 친구이자 대학교 동기 2명이 모인 팀으로써 결속력이 끈끈한 팀이었습니다. 저희는 신소재공학과로써 AI와 신소재공학을 결합한 대회에 참가한 것을 시작으로 AI + MSE(신소재공학) 팀이 시작되었습니다.

:스튜디오_마이크:

여러분을 돋보이게 한 특별한 점은 무엇인가요?

저희팀은 주어진 과제를 해결하기 위해 가장 먼저 VLM을 생각하였습니다. 저희팀 특유의 깊은 탐색 능력을 통해 task에 어울리는 모델들을 찾을 수 있었고, 이후 OCR과 VLM을 결합한 2-stage로 확장해나가며 성능을 높이는 것을 우선적으로 해결하려 하였던 것이 특별했던 점인 거 같습니다.

:스튜디오_마이크:

이번 성과의 비결은 무엇이라고 생각하시나요?

컴퓨터비전에 대한 근본적인 이해를 하려고 했던 것이 비결이라고 생각합니다. 주어진 task는 어떤 컴퓨터비전 영역에 해당하여 어떤 모델이 필요할 지, 모델이 뱉는 결과에 대한 confidence는 어떻게 구성할 수 있는지, submission 되어야 하는 형태와 평가지표는 어떤 지 근본적으로 이해하고 풀어보려 했던 점이 이번에 잘 맞아 떨어졌던 거 같습니다.

:스튜디오_마이크:

대회 기간 중 특별히 기억에 남는 순간이 있다면 공유해 주세요.

모델 구조를 one-stage에서 two-stage로 크게 전환했을 때가 가장 기억에 남습니다. 논의를 거쳐 성능이 개선될 거라 기대하며 예시 데이터로 먼저 실험해봤는데, 기대보다도 체감 성능이 확연히 향상되었습니다. 특히 리더보드 추론 결과에서 성능이 거의 70% 향상된 것을 확인했을 때 가장 짜릿한 순간이었습니다.

:스튜디오_마이크:

데이터 분석이나 학습 과정에서의 나만의 비법이 있다면요?

제가 모르는 분야의 데이터를 학습해야 할 때가 많습니다. 이럴 때는 무엇보다 데이터를 직관적으로 이해하는 데 집중합니다. 직접 EDA를 진행하기도 하고, 기존에 수행된 연구나 공개된 노트북들을 참고하면서 전체적인 감을 잡습니다. 그렇게 데이터를 이해하다 보면 어떤 학습 방법이 필요할지 자연스럽게 아이디어가 연쇄적으로 떠오르고, 그 과정에서 새로운 기법을 직관적으로 이해한 뒤 다시 필요한 기술을 공부하는 반복 학습 사이클을 만들어가는 편입니다.

:스튜디오_마이크:

수상을 기념하여 빌 수 있는 한 가지 소원이 있다면?

이번이 AIMSE팀의 첫 리더보드 경진대회 수상인데, 앞으로도 좋은 결과 이어가고 싶습니다!

:스튜디오_마이크:

앞으로의 목표와 꿈을 말씀해 주세요.

경진대회 계속 참여하면서 모델 성능 개선을 위한 방법론을 많이 배우고 싶고, 하고있는 AI 연구도 잘 되었으면 합니다! 최종적으로 편하고 좋고 빠른 AI 소프트웨어를 만들고 싶습니다 :)

:스튜디오_마이크:

데이콘 커뮤니티에 바라는 점이 있다면 무엇인가요?

지금처럼 그리고 더 나아가 고품질 데이터 기반 AI 연구가 진행될 수 있는 주제의 대회가 많이 개최되었으면 좋겠습니다!


로그인이 필요합니다
0 / 1000
진욱
2025.10.02 10:41

발표 인상 깊었습니다! 고생하셨습니다~

konhoe
2025.10.02 12:14

진욱님도 너무 고생하셨습니다~ 감사합니다!!