2022 Samsung AI Challenge (3D Metrology)

2022 Samsung AI CHALLENGE (3D Metrology) 수상자 인터뷰_민초맛 대흉근

2022.11.02 08:29 1,466 조회

2022 Samsung AI Challenge (3D Metrology)

🎉 Team 민초맛 대흉근 님, 수상을 진심으로 축하합니다. 🎉


🏆 위성진, 정재윤, 장준보 님

 

🎙우승팀 중 한 팀이 되었는데요, 수상을 진심으로 축하드립니다. 수상 소감 부탁드립니다.

위성진

열심히 한 만큼 좋은 성적을 얻어서 기쁩니다!

 

정재윤

정말 흥미로운 주제를 가진 대회였고, 치열했던 대회였습니다. 특히 마지막날에 1~5등간의 순위교차가 계속해서 이루어지면서, 끝까지 긴장을 놓을 수 없었습니다. 상위권 분들 모두 수고하셨습니다. 저희 팀원 모두가 끝까지 포기하지 않고 대회를 진행한 덕에 수상했다고 생각합니다. GPU를 쉬지 않게 계속해서 돌리고, 자주 미팅을 하며 수정 및 보완을 해나갔기 때문에 수상할 수 있었던 것 같습니다.

 

장준보

먼저 재밌는 대회 열어주신 삼성종합기술원과 DACON 측에 감사의 말씀드립니다. 그리고 이번에 좋은 팀원들과 함께 대회를 나가게 되어 많이 배우고 발전하는 시간을 가진 거 같아 팀원들에게도 감사의 말씀 드립니다.

 

🎙데이터 분석에 관심을 가지게 된 계기나 데이터 분석 일을 하게 된 이유가 있다면 무엇인가요?

위성진

사회에서 가장 주목 받는 분야 중 하나기도 하고, 데이터 분석이나 머신러닝 딥러닝에 대한 공부가 너무 재밌어서 꾸준히 관심을 가지고 있습니다.

 

정재윤

저는 예전부터 공상과학 영화를 좋아했고, 스타워즈의 R2D2같은 나만의 로봇을 가지고 싶다는 생각을 해왔습니다. 이런 상상이 발전해서 나만의 AI를 만들려면 AI를 공부해야겠다! 라고 생각하게 되었고, 이 생각이 변하지 않고 AI에 대한 관심도와 흥미는 꾸준히 늘어갔습니다.

따라서 대학교도 관련 학과인 숭실대 AI융합학부에 입학하게 되었으며, 1학년 때부터 꾸준히 관련 공부와 경진대회를 나가면서 AI를 공부하고 데이터를 분석하는데 재미를 느껴왔기 때문에 계속해서 하고 있는 것 같습니다.

 

장준보

군대 입대부터 전역하기까지 많은 시간동안 어떤걸 하고 살지에 대해 고민하는 시간을 가졌으며 많이 고민한 결과 데이터를 다루는 일이 재밌고 학교 수업에서도 흥미를 느껴 시작하게 되었습니다.

 

🎙데이콘 경진대회에 참여한 동기가 있나요?

위성진

예제를 따라하거나 간단한 교육용 데이터셋이 아닌, 좀 더 복잡하고 많은 사고를 필요로 하는 프로젝트를 진행해보고 싶었고, 삼성과 데이콘에서 진행한 이번 경진대회가 좋은 기회가 될 것이라고 판단해 참여했습니다.

 

정재윤

이전에 데이콘에서 진행한 대회에도 참여를 자주 하였고, 평소에도 데이콘 관련 경진대회를 눈여겨 보기 때문에 발견해서 참여하게 되었습니다.

 

장준보

실무적인 데이터를 다뤄보고 공부한 내용을 써먹을 수 있는 것이 공모전에 참여하는 것이라고 생각하였고 흥미로운 분야를 찾을 수 있는 계기가 될 수 있을 것이라는 생각이 들어 DACON 경진대회에 참가하게 되었습니다.

 

🎙학업, 현업, 일상생활 등과 관련해서 대회 중 느낀 점이 있나요?

위성진

아무래도 대회와 학업을 병행하다보니 피곤함도 느끼고 일상생활에도 어느정도 무리가 오긴 했지만, 흥미로운 데이터와 팀원들의 열정적인 참여 덕분에 끝까지 집중력을 유지할 수 있었습니다.

 

정재윤

확실히 학업과 대회 여러개를 병행해서 진행하려고 하니 힘든 것 같습니다. 다만 바쁜 여건에서도 GPU는 무조건 계속해서 돌리는 것이 대회에서 상위권을 차지하게 된 비결이 아닌가 싶습니다.

 

장준보

항상 느끼는 거지만 인공지능이라는 분야, 그리고 데이터를 활용하는 일이 모든 분야에 적용되고 있다고 생각하고 있고 앞으로도 인공지능이 더 다양한 분야에 적용되어 활용될 수 있겠구나 라는 생각이 들었습니다.

 

🎙대회 기간 중 가장 힘들었거나 어려웠던 점이 있었나요?

위성진

데이터를 이해하는 것 자체가 조금 어려웠습니다. SEM 주사전자현미경에 대해서 이번에 처음 접하기도 했고, train의 average_depth.csv 데이터가 초기에 세운 가설과 일치하지 않아 데이터 이해 과정에서 많이 헤맸습니다. 또 unpaired dataset을 잘 활용해야하는 문제였는데, 아무래도 일반적인 paired dataset의 경우보다 더 많은 고민을 필요로 했던 것 같습니다.

 

정재윤

이번 대회는 대회의 문제와 목표를 정의하는 점이 조금 어려웠습니다. 다만 이 점이 삼성에서 의도한 점이라고 나중에 들어보니 진입 장벽을 일부러 높인 것이 아닌가 생각합니다.

또한, 쌍이 없는 데이터셋을 GAN에 학습시키다 보니, GAN 모델이 제대로 학습되는지 아는 것이 어려웠습니다. 따라서 나중에는 학습시 loss 뿐만 아니라, pixel 분포 그래프를 그려서 train의 분포와, transffered simulation의 분포를 비교하는 방식으로 학습 진척도를 추가로 확인했습니다.

 

장준보

아무래도 도메인 지식이 부족하기 때문에 데이터를 이해하는 것이 힘들었습니다.