분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
2022 AI 대학원 챌린지
2022 AI 대학원 챌린지 수상자 인터뷰 _ AMLL
🏆 송태경, 문아성, 오해성, 이태원, 이한용 님
🎙우승팀 중 한 팀이 되었는데요, 수상을 진심으로 축하드립니다. 수상 소감 부탁드립니다.
송태경
데이콘 대회 목록들을 보면서 이런건 어떻게 수상하지, 어떻게 데이터들을 전처리하고 모델을 구현하지 동경만 했었는데 팀원들과 같이 준비한 대회에서 수상을 하게 되어 기쁩니다. 혼자하면 막혀서 포기했을거 같은 문제들도 팀원들과 함께 고민하고 아이디어를 나누면서 해결할 수 있지 않았나 싶습니다. 같이 고생해준 팀원들에게 감사를 표하고 싶습니다.
문아성
처음 참가하는 대회였기 때문에 서툰 부분이 많았는데, 생각지도 못한 과분한 상을 타게 된 것 같습니다.
이번 대회를 계기로 하여 인공지능 분야에서 더 큰 발전을 이룰 수 있도록 노력하겠습니다. 감사합니다.
오해성
챌린지 과정에서 어려운 점도 많았지만 팀원들과 함께 고민하면서 하다보니 생각보다 좋은 결과를 얻게 되어 좋았습니다.
이태원
처음으로 참가하게 된 대회에서 수상을 하게되어 기쁩니다.
대회가 끝나고 난 뒤에 아이디어가 더 생각나서 아쉬움이 많았던것 같습니다.
이한용
이번 2022 AI 대학원 챌린지에서 수상하게 되어 매우 기쁩니다. 팀원들의 노고가 없었다면 수상하지 못했을 것 같아 팀원들에게 고마움을 전하고 싶습니다.
개인적으로는 이번 대회를 통하여 다양한 머신러닝 방법론과 데이터 분석 기법들을 배울 수 있는 가치있는 경험이 되었습니다.
🎙데이터 분석에 관심을 가지게 된 계기나 데이터 분석 일을 하게 된 이유가 있다면 무엇인가요?
송태경
데이터 분석보다는 데이터들을 이용하여 모델을 설계하고 성능을 확인하는 부분에 더 관심이 많았었는데 이번 대회를 계기로 데이터 분석에 관심을 더 가지게 된 거 같습니다. 주어진 데이터를 가공하여 새로운 데이터를 생성하기도 하고 데이터들 간의 연관성을 분석하는 등 분석 업무의 중요성을 깨달을 수 있었고, 다양한 방법들에 대해 더 알아보고 싶습니다.
문아성
빅데이터를 통해 데이터 가공만 잘하면 엄청난 가치가 있을 것이라고 판단하였으며,그것을 통해 데이터 기반으로 처리하는 인공지능 기술을 이용한다면 지금과는 완전히 다른 기술이 나올 것이라고 확신하게 되어 데이터 분석 일에 본격적으로 시작한 것 같습니다.
오해성
딥러닝 관련해서 공부를 하다보니 당연히 데이터 자체에 관심을 갖게 되었고 어떻게 데이터를 다루어야 하는지에 관심이 많아졌습니다.
이에 데이터 분석을 하고 싶어진 것 같습니다.
이태원
학부 전공이 통계학 이다보니 자연스럽게 데이터분석에 관심을 가지게 되었습니다.
이한용
학부 4학년 때 수강한 머신러닝 강의에서 처음 데이터 분석을 접하게 되었습니다.
데이터를 기반으로 예측하는 방법을 자동으로 학습하는 머신러닝의 방법이 흥미로워서 더 공부해 보고 싶다는 생각을 하게 되었습니다.
그 이후로 머신러닝 연구실에 학부연구생으로 공부를 하다가 자연스럽게 해당 연구실에 석사과정으로 진학하게 되었습니다.
그래서 현재는 딥러닝과 자연어 처리 분야를 공부하고 있습니다.
🎙대회에 참여 중 어려운 점이 있었나요? (일정 관리, 분석 방법론 등)
송태경
분석 방법론이나 데이터 컬럼 간의 상관관계 분석 같은 부분이 어려웠던거 같습니다. 그리고 해당 도메인에 대한 사전지식이 부족하여 전처리에 어려움을 겪었었습니다. 다음 대회에 참여하게 된다면 모델링보다는 분석 단계에 더 많은 시간을 투자할 것 같습니다.
문아성
도메인 지식이 부족하였던 것이 가장 힘들었습니다.
도메인 분야에서 예측하는데 중요하게 생각하는 특징들을 파악하는데 시간이 많이 소요되었습니다.
오해성
중간중간 갑자기 쓰면 안되는 변수들이 있다는 공지를 받았는데 그 당시 그 변수를 활용하여 분석을 진행하고 있었어서 당황스러웠던 것 같습니다.
또한 tabular data의 분석을 제대로 경험해본 것이 처음이라 다양한 접근 방법을 알지 못했고 이를 공부하는 과정이 어려웠습니다.
이태원
잘 알지못하는 도메인이다보니 데이터를 어떻게 전처리해야할지에 대한 탐색과 고민이 많이 필요했던것 같고 팀간의 의견조율 또한 중요한것 같습니다.
이한용
이번 대회의 주제인 단백질과 관련한 생리학적 기반지식이 없어서 데이터 분석에 어려움이 있었습니다.
그리고 이런 대회가 처음이라 어떤 머신러닝 모델을 사용해야 하는지에 대해서도 어려움이 있었습니다. 하지만 팀원들이 많은 도움을 주었고, 스스로 머신러닝을 공부하면서 문제들을 해결했습니다.
또한 마감을 며칠 남기고 테스트데이터에 대한 규칙이 추가되는 일이 있었습니다. 이 이후에 학습한 모델의 성능이 높게 나오지 않아서 좌절이 있었지만 포기없이 대회를 진행하여 좋은 결과를 달성할 수 있었습니다.
🎙설문에 없는 내용 중 더 하고 싶은 말이 있나요?
송태경
이번 대회 진행 중, 대회 종료 5일전 특정 컬럼의 사용 금지에 대해 공지를 전달 받았습니다. 대회 종료 5일전 이면은 대부분의 팀들이 데이터에 대한 분석을 마치고 모델 튜닝을 통해 성능 향상을 시도하고 있을 시기인데, 갑작스런 공지로 인해 데이터 분석과 모델 설계를 촉박한 시간 내에 다시 진행해야 했습니다. 이 부분은 추후 개선될 필요가 있을것 같습니다.
문아성
앞으로도 더 좋은 대회 부탁드립니다.
오해성
좋은 경험을 할 수 있게 해주어 너무 감사합니다.
이한용
다시 한번 팀원들에게 고맙다는 말을 전하고 싶습니다.
AMLL 팀 5등 코드 공유 보러가기
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved