분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
신용카드 사용자 연체 예측 AI 경진대회 1위 소회의실 팀 우승자 인터뷰
🏆 김진유, 이현지, 장예지 님
🎙우승팀 중 한 팀이 되었는데요, 수상을 진심으로 축하드립니다. 수상 소감 부탁드립니다.
김진유
데이터분석 공부하면서 동시에 참여한 첫 데이콘이었는데 결과까지 좋아 정말 기분 좋습니다. 같이 고생한 팀원들과 기회 마련해주신 데이콘에게도 감사합니다. 인사이트 공유해주신 모든 분들께도 감사드립니다. 엄청난 코드를 짠 것은 아니지만 매일매일 제출을 한번이라도 하자는 생각에 보너스로 운도 따라줘서 1위라는 결과를 얻었다고 생각합니다.
이현지
첫 데이콘이었는데 옆에서 함께 해준 팀원들 덕에 좋은 성과를 내게 되어 기쁘네요. 대회 참여하면서 중간에 막막한 순간도 많았는데 꾸준히 시도해준 팀장님 덕에 끝까지 할 수 있었던 것 같아요. 같이 한 팀원들께 진심으로 감사인사를 전하고 싶습니다.
장예지
처음 참여한 대회에서 수상을 하게 되어 기쁩니다. 같이 고생한 팀원들과 다른 참가자 분들 모두 수고하셨습니다.
🎙데이터 분석에 관심을 가지게 된 계기나 데이터 분석 일을 하게 된 이유가 있다면 무엇인가요?
김진유
예전부터 우리 사회에서, 일상에서 일어나는 일에 참 관심이 많았습니다. 데이터 분석을 통해 다양한 시각을 얻을 수 있다는 것이 매력적으로 다가왔고 이쪽 일을 하기로 마음먹었습니다.
이현지
전공 수업 중에 데이터를 모델에 넣어서 통계적인 분석을 하는 수업이 있었는데 그 때 처음으로 파이썬을 이용해서 데이터를 분석하는 기초적인 경험을 하게 되었어요. 그 수업을 계기로 데이터 분석에 관심을 갖게 되었고, 따로 데이터 분석 관련 교육을 받으면서 공부를 하는 중입니다.
장예지
데이터 분석 수업을 들으면서 모델을 학습하고 예측하게 하는 기계학습에 대해 흥미를 느꼈습니다.
🎙데이콘 경진대회에 참여한 동기가 있나요?
김진유
가장 큰 동기는 아무래도 실력을 키우기 위함입니다. 제가 직접적으로 컴퓨터나 데이터분석 관련 전공을 한 것도 아니었고 본격적으로 데이터 분석 공부를 한지가 오래되지 않아 예제수준의 학습에 머물렀었는데 데이콘을 통해 새로운 데이터 구경도 해보고, 이런저런 모델링도 해보고 싶었습니다. 결과적으로 많이 배울 수 있었습니다.
이현지
데이터 분석 교육을 들으면서 다른 사람의 코드를 따라하는 게 전부였는데 한 번 그 동안 배운 것들을 적용해보는 일이 필요하겠다는 생각이 들었어요. 마침 이 대회가 그 동안 배운 머신러닝 기법들을 적용하기에 좋을 것 같아서 팀원들과 같이 대회에 참여하게 되었습니다. 대회에 참여하는 동안 처음부터 끝까지 코드를 다 작성해보고, 그 동안 배운 모듈들을 코드 속에 녹이면서 배운 것들을 정리할 수 있었던 것 같아요.
장예지
다른 참가자 분들이 공유해 주신 코드를 보면서 공부하기 위해 참여하였습니다. 공유된 코드를 참고하면서 코드를 개선하였고 이번 대회를 통해 성장할 수 있었습니다.
🎙학업, 현업, 일상생활 등과 관련해서 대회 중 느낀 점이 있나요?
김진유
피쳐 하나, 모델 파라미터 하나씩 바꿔보면서 든 생각인데, 선입견 가지지 않고 열린 생각을 하는 것이 참 중요하다는 것을 다시금 느꼈습니다. 그런 과정 중에서 핵심이 되는 피쳐와 모델을 찾게 되었으니까요.
이현지
데이터분석 공부를 시작한지 아직 몇 개월이 되지 않아서 스스로가 부족함을 많이 느꼈어요. 대회 초반에는 그 동안 배운 모듈들을 적용하는 데에도 실수가 많았고, 중반에는 제가 만든 모델이 과적합이 되어서 좌절도 많이 한 것 같아요. 그럴 때마다 팀원들과 같이 코드를 공유하면서 제 코드의 어떤 부분이 잘못됐는지 점검하고, 어떻게 코드를 수정해갈지 의논하면서 방향을 잡아갔습니다. 스스로 부족함도 많이 느꼈지만 그만큼 많이 배운 시간이 된 것 같아요.
🎙대회에 참여 중 어려운 점이 있었나요? (일정 관리, 분석 방법론 등)
김진유
모든 분들이 그러셨겠지만 중요 파생변수를 찾아내는데 고민을 많이 했습니다. 추가하고 지워보고 다시 바꿔보면서 절대적인 시간투자로 극복했는데 앞으로 다른 데이터 분석을 해보면서 Feature Engineering 경험을 많이 쌓을 필요가 있겠다 싶었습니다.
이현지
데이터셋에 대한 피처 엔지니어링이 가장 어려웠어요. 기존에 캐글에 올라온 데이터셋과 비교했을 때, ID가 따로 부여되지 않아서 중복을 제거할지 결정을 내리는 데에도 여러 번 번복을 했어요. 이후, 저희는 중복을 제거하지 않고 진행했는데 그 때는 또 어떤 컬럼을 추가해야 할지도 정말 많이 고민해야 했어요. 과적합을 피하면서 점수를 좋게 만드는 컬럼 찾기가 정말 어려웠는데 여러 번 시도 끝에 점수를 최대한 내렸던 것 같아요.
장예지
데이터에서 중요한 피쳐를 찾는 것이 어려워 다양한 파생변수들을 생각하는 데 많은 시간을 보냈습니다.
🎙데이콘에 기대사항이 있나요?
김진유
지금처럼 다양한 대회 많이 열어주시면 좋겠습니다 또한 코드공유나 토론에 글 올려주시는 분들에게 인센티브가 더 있었으면 좋겠어요.
이현지
앞으로도 다양하게 데이터 분석대회를 많이 열어주셨으면 좋겠어요. 참가할 대회를 찾으면서 이미지나 영상 데이터가 아닌 정형데이터로 된 된 대회가 많지 않아 아쉬웠는데 앞으로 정형데이터로도 더 다양한 대회들이 생겼으면 좋겠어요.
소회의실 팀 1등 코드 공유 보러가기
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved