월간 데이콘 음성 중첩 데이터 분류 AI 경진대회

“결국 꾸준히 매달리며 노력하는 것이 승패를 가르는 게 아닐까 하는 생각이 들었습니다.”

2020.11.12 10:34 2,206 Views

음성 중첩 데이터 분류 AI 경진대회



 음성 중첩 데이터 분류 AI 경진대회는 ‘AI가 목소리를 분류할 수 있을까?’라는 질문에 대한 대답을 얻고자 열린 대회였습니다. 데이터 파일의 확장자도 평가식도 생소한 대회였지만 참여팀은 이러한 장벽을 극복하고 훌륭한 솔루션을 제시하였습니다.

 

 우승팀 ‘JunhoSun’, ‘bbchip13’ 그리고 ‘Jamm’의 인터뷰가 지금부터 시작됩니다.




Q1. 수상을 진심으로 축하드립니다. 대회에 우승하신 소감이 어떠하신가요?





JunhoSun - 처음에는 다양한 model 구조를 실험해 보았는데 만족스러운 결과를 얻을 수 없었습니다.

대부분의 시간을 데이터 augmentation에 할애한 결과 다행히 좋은 결과를 얻은 것 같아 만족스럽습니다.





bbchip13 - 감사합니다. 기분 되게 좋네요.




Jamm - 월간 데이콘 5에서 처음으로 랭킹 포인트를 받아보고, 이번 월간 데이콘 6에서 처음으로 상금도 받았습니다.

이번에는 운도 잘 따라 주었다고 생각하고, 그동안 공부한 것들이 결실을 보는 기분도 들어서 너무 기쁩니다.





Q2. 데이터 분석에 처음 관심을 가지게 된 계기가 무엇인가요?





bbchip13 - 인공지능으로 여자친구 만들고 싶어서 시작했습니다. 하다 보니 현실에서 찾는 게 더 쉽다는 걸 깨달아서 지금은 어떻게 하면 이걸로 사회에 기여할 수 있을지에 대해 관심을 가지고 있습니다.



Jamm - 2년 전에 페이스북 광고를 통해 데이터 분석과 머신러닝이라는 것이 있다는 것을 알게 되었습니다.

그때는 파이썬이 뭔지도 몰랐었는데 일단 재미있어 보여서 'Hello World!' 부터 무작정 시작해보았습니다.





Q3. 데이콘의 AI 경진대회에 참가한 동기는 무엇인가요?





bbchip13 - 대학원에서 음성과 뇌공학 쪽 연구를 하고 있고, 마침 쓰는 데이터가 비슷해서 참가해보게 되었습니다.





Q4. 학업, 현업, 일상생활 등과 관련해서 대회 중 느낀 점이 있나요?





Jamm - 데이터 관련된 것이나 머신러닝 관련 지식뿐만 아니라 항상 새로운 분야를 공부할 때마다 드는 생각이지만, 세상에는 정말 대단한 사람들이 참 많은 것 같다고 생각합니다. 그래서 새로운 지식의 바다를 마주할 때면 항상 경외감이 들곤 합니다.




bbchip13 - 아직 제 실력이 많이 부족하다는 것을 느꼈습니다. 정말 조금의 차이로 순위가 결정되는 것을 보고 결국 꾸준히 매달리며 노력하는 것이 승패를 가르는 게 아닐까 하는 생각이 들었습니다.





Q5. 대회에 참가 중 어려운 점은 무엇이었나요?





JunhoSun - Variance를 줄이기 위해 bagging 기법을 도입해서 긴 학습 시간이 필요했습니다. 효율적으로 시간을 활용하는 법을 찾는 측면에서 어려움을 겪은 것 같습니다.



bbchip13 - 사실 모델을 만들고 데이터 분석하는 게 어려웠다기보다는 현실적인 부분에서 장벽을 만났습니다. 다들 학생들이라 돈을 모아 클라우드를 공유하였는데, 그 인프라를 갖추기까지 들인 시간이나 팀원들끼리 누가 언제 사용할지 조율하는 측면에서 어려움을 겪었습니다.





Jamm - 몇 가지 어려웠던 점은, 음성 데이터가 처음이어서 손을 못대고 있던 시간이 있었습니다. 데이콘에서 baseline 코드를 올려주시기 전에는 아무 생각도 안 들었었습니다.

하하… 또... 전에 사용하던 컴퓨터가 게이밍노트북이었는데, 데이터 로딩부터 학습까지 너무 느려서 답답했지만 이건 대회 중간에 상금을 당겨쓴다는 각오로 새 컴퓨터를 장만해서 해결했네요...