자율주행 센서의 안테나 성능 예측 AI 경진대회

자율주행 센서의 안테나 성능예측 AI 경진대회 우승자 인터뷰_kops

2022.11.01 17:25 1,281 Views

자율주행 센서의 안테나 성능예측 AI 경진대회

🎉 Team  kops 님, 수상을 진심으로 축하합니다. 🎉


🏆 김민석, 오윤주, 박정기, 장시연 님

 

🎙우승팀 중 한 팀이 되었는데요, 수상을 진심으로 축하드립니다. 수상 소감 부탁드립니다.

김민석

수상 감사드립니다. 사실 이러한 인공지능 경진대회는 처음으로 참여하게 되었는데, 첫 참여부터 수상하게 되어 감회가 깊습니다. 제가 팀장으로서 팀을 이끌어나갔지만, 서로 팀을 이끌어주시고 많은 의견을 주신 팀원들께 더욱 더 감사드립니다. 팀원들 없이 저 혼자만 이 대회에 참여했다면, 수상하지 못했을 것입니다. 또한 이런 대회를 주최해주신 데이콘과 LG에도 깊은 감사드립니다.

 

오윤주

다른 쟁쟁한 경쟁자 분들이 너무 많아 수상을 할 수 있을지 몰랐는데 수상을 하게 되어 너무 기쁩니다. 또한 라이더라는 센서 데이터에 대해서 처음 접하게 되었는데, 이렇게 데이터에 대해 배경 지식이 없더라도 원하는 목표를 도출해내기 위해 어떠한 고민을 하고 시도를 해봐야 하는지 많은 것을 배울 수 있는 기회가 되어 너무 좋았습니다. 그리고 이 기회로 좋은 동료들을 알게 되어 매우 든든합니다. 다음에도 이러한 좋은 기회가 있으면 다시 참여해 보고 싶습니다.

 

박정기

경진대회에서 수상할 수 있어서 행복했습니다. 지속해서 공부해왔던 분야에서 제가 성과를 낸다는 경험을 할 수 있어서 기분이 좋았습니다. 어떠한 한 문제에 대해서 계속 고민하고, ML/DL로 문제를 풀어나가는 과정이 재밌고, 즐거웠습니다. 앞으로도 DACON에 있는 많은 대회에 더 참가하고 싶었고, 더 많은 성공 경험을 통해서 DATA를 활용하여 문제를 해결해 나가는 엔지니어가 되고 싶습니다.

 

장시연

데이터분석대회 참여는 처음인데 좋은 결과를 얻을 수 있어 기쁩니다. 대회 기간동안 팀원들과 어떻게 풀어나갈 지 고민하고 공부하면서 연구하면서 스스로도 많이 성장했다고 생각합니다.

 

🎙데이터 분석에 관심을 가지게 된 계기나 데이터 분석 일을 하게 된 이유가 있다면 무엇인가요?

김민석

저는 사실 인공지능과는 멀리 떨어져있는 사람이었습니다. 화학공학과를 졸업하여 장교생활을 하며, 미래에 외국 대학원으로 진학할 생각을 가지고 있었습니다. 그러나 2020년 판데믹이 터지며 해외진학에 대해 다시금 고민하게 되었고, 퇴근 후의 시간을 어떻게 쓸지 고민하게 되었습니다. 이 시기 많은 책을 읽게 되었고, 미래 산업은 인공지능을 중심으로 재편된다는 것을 깨달았습니다. 이 깨달음을 토대로 퇴근 후의 시간이나 주말을 모두 데이터 과학이라는 학문에 쏟아부었습니다. 이러한 시간이 쌓이고 쌓여 대회에 수상할 수 있는 실력을 길러주었던 것 같습니다.

 

오윤주

카드사 콜센터 아르바이트를 하며 무수한 데이터가 쌓이는 것을 직접 경험하였습니다. 하나의 카드사에도 빅 데이터라고 부를 정도로 하루에도 매우 많은 양의 데이터가 수집이 되었고, 이러한 데이터를 좀 더 유용한 방법으로 활용을 할 수 있지 않을까라는 생각에 데이터를 분석하는 것에 있어 관심을 가지게 되었습니다. 그 후 데이터 분석에 대해 여러 학습을 해왔습니다.

 

박정기

처음에 k-digital 트레이닝 국비 지원으로 코드스테이츠 AI 부트캠프 2기를 수료했을 때, AI에 대해서 가볍게나마 공부할 수 있었고, 컴퓨터 비전 쪽 문제를 딥러닝을 통해 풀어나가는 인턴 생활도 해봤습니다. 점점 다양한 DATA를 활용하여 ML/DL로 문제를 풀어나가는 과정을 지속해서 공부할 수 있었고, 실제로도 엔지니어링을 통해 모델을 개발하고 운영하고 관리하고 실험을 통해 성능을 개선해 나가는 과정이 즐거워서 이러한 일을 하게 됐습니다.

 

장시연

저는 기존에는 사회과학을 공부하고 연구하던 사회과학도이자 사회과학자였습니다. 미디어와 사회에 대한 관심은 여전히 변함없지만 데이터분석을 통해 더 많은 사회 현상을 분석하고 이해할 수 있고 이제는 어쩌면 데이터 없이는 불가능하다고 생각합니다. 제가 하고 싶은 것을 더 잘하기 위해 데이터분석을 시작하게 되었습니다.

 

🎙데이콘 경진대회에 참여한 동기가 있나요?

김민석

저는 데이콘이라는 사이트조차 알지 못하며, 창업을 위해 여러 사업 아이디어들을 정리하는 중이었습니다. 이 때, 얼마 전 수강했던 교육인 ICT 이노베이션 인공지능 서비스 기획 과정에서 같은 팀으로서 과제를 수행던 팀원이 팀을 꾸린다며 연락해왔습니다. 이 팀원을 통해 4명의 팀을 꾸리게 되었습니다. 팀원 모두 나이, 사는 지역 모두 달랐지만, 원격회의로 매주 만나고 새로운 기술들을 학습하며 대회에 참여하였습니다.

 

오윤주

같이 스터디를 하시는 분 중에 그동안에 공부를 해왔던 것을 토대로 활용해 볼 수 있는 활동을 하고자 하셨습니다. 데이터 분석, 데이터 처리, 머신 러닝, 딥 러닝 등에 있어 공부를 하고 있었고 이를 활용해 볼 수 있다면 다양한 데이터를 만날 수 있으며 공부의 방향과 비슷하다고 생각이 드는 데이콘 경진대회가 제일 적합하다고 생각하였습니다. 이에 참여하게 되었습니다.

 

박정기

팀원들과 어떠한 대회를 신청해야 할지 검색하던 도중 DACON에서 LG 주최로 하는 대회가 눈에 띄었고, 팀원 중에 공정데이터를 분석하고, 모델을 만드는 분이 계셔서 도움이 될 것 같아 신청하게 됐습니다. 저는 제가 아는 멘토님께서 공정 데이터로 AI 모델을 만든 경험을 가지고 계셔서 많은 질문과 도움을 받을 수 있었음에 감사한 경험 또한 가지고 있습니다. 좋은 대회를 DACON 측에서 잘 열어주셔서 감사했습니다.

 

장시연

함께 공부하던 스터디원들과 공부한 것을 적용해보자는 마음으로 참여하게 되었습니다.

 

🎙대회 기간 중 가장 힘들었거나 어려웠던 점이 있었나요?

김민석

가장 힘들었던 점은 도메인 지식의 부족이었습니다. 팀원 내에 레이더에 관한 지식을 가진 사람은 아무도 없었습니다. 또한 레이더에 관련된 논문을 보더라도 과연 변수들이 무엇을 의미하는지 알기 힘들었습니다. 여러 파생변수를 생성해보아도 성능은 향상되지 않았습니다. 또한 학습에 필요한 컴퓨팅 자원도 부족했습니다. 이를 극복하기 위해 팀원들 전부가 각자 컴퓨터로 동시에 학습을 진행하기도 하였습니다.

 

오윤주

모델링을 쌓는 것 보다는 데이터를 어떻게 만져야 할지 너무 막막했습니다. 데이터를 분석하고 최적의 값을 도출해내는 것에 있어 데이터 전처리의 중요성을 알기 때문에 더욱더 고려를 하고 시도를 해보았지만 결과가 미미하거나 더 안 좋게 나왔을 때는 커다란 벽에 부딪힌 것 같이 너무 막막했습니다. 또한 이렇게 한계를 느낄 때에 어떠한 돌파구를 찾아야 하는지 이러한 점이 대회 기간 중에 제일 어려웠던 것 같습니다.

 

박정기

가장 힘들었던 점은, 많은 실험에도 불구하고 성능이 크게 향상되는 부분을 찾기가 매우 어려웠다는 점과 레이다 공정 데이터에 대한 도메인 지식이 팀원 중에 단 한 명도 가지고 있지 않았다는 점입니다. 또한 이러한 공정 데이터를 다룰 때 필수적으로 적용해야 하는 것에 대해서도 알지 못해서 EDA나 Feature engineering을 할 때 가장 어려웠던 것 같습니다. 또한 가지고 있는 컴퓨팅 자원 또한 제한적이어서 오직 COLAB으로만 데이터를 학습시켰던, 부분이 힘들었습니다.

 

장시연

제가 참여한 대회는 자율주행 성능 예측대회였습니다. 관련 도메인 지식이 전무하다보니 느껴지는 아쉬움이 있었습니다. 데이터를 이해하는데서부터, 피쳐 엔지니어링을 하고, 모델링을 할 때까지 내가 이 분야에 대해 좀 더 알았다면 어땠을까 하는 생각이 있었습니다.

 

🎙대회에서 최종 수상할 수 있었던 요인이 무엇인가요?

김민석

저희는 데이터에 관한 관점을 바꾸어 도메인 지식에 국한되는 것이 아닌, 순수한 정형 데이터의 전처리에 대해 고민하였습니다. SHAP을 통해 결과에 영향이 적은 인자를 제거하며, PCA를 통해 다중공선성을 해소하였고, 이상치를 제거했습니다. 또한 하이퍼파라미터 튜닝을 통해 성능을 극한으로 이끌어내었고, 이러한 모델들을 스태킹 앙상블을 통해 최고의 성능으로 통합해내었습니다. 무엇보다 이러한 결과는 팀원 모두가 새로운 방법을 시도해보는 수많은 실험을 통해 이루어질 수 있었습니다.

 

오윤주

여러 가지 모델을 적용해 보고 좀 더 나은 결과를 얻기 위해 해보았던 실험들이 최종적으로 많은 영향을 끼치지 않았나 생각이 듭니다. 그래서 하나의 결과를 얻기 위해 할 수 있는 모든 시도와 노력을 하는 것의 중요성을 다시 깨닫게 되었습니다.

 

박정기

팀원들과 다양한 실험, 그리고 KAGGLE, DACON에서 수상한 코드를 사례조사 하는 과정을 통해서 수상할 수 있었다고 생각합니다. 또한 COLAB 자원을 병렬적으로 활용하여 제한된 시간 내에 효율적으로 모델을 학습하고, 성능평가를 할 수 있어서 많은 제출을 통해 저희 모델의 성능을 높일 수 있었다고 생각합니다. 팀원들과 매주 최소 2회는 같이 회의해서 많은 아이디어를 얻고, 또한 제가 존경하는 멘토님께도 많은 조언을 받아 더 많은 실험을 통해 앞으로 나아갈 수 있었다고 생각합니다.

 

장시연

대회 기간동안 같이 고민하고 실험하던 팀원들이 수상할 수 있었던 가장 큰 요인 같습니다.

 

kops 3등 코드 공유 보러가기