KBO 외국인 투수 스카우팅 최적화 경진대회

KBO 외국인 투수 스카우팅 대회 1위 수상자 인터뷰 (안성진)

2020.01.05 15:57 1,054 조회

KBO 외국인 투수 스카우팅 대회

전공분야(학력)

 

전공(학력): 소비자가족학과(학사 재학) / 대학생

 

수상을 진심으로 축하합니다. 수상 소감 부탁드립니다.

 

개인으로 공모전을 나가서 처음으로 좋은 결과를 거두게 되어서 기분이 좋습니다. 지하철을 타고 가다가 휴대폰으로 이메일을 확인하던 도중 결과를 알게 되었는데, 처음 내용을 확인 했을 때는 어안이 벙벙했습니다. 이메일 내용을 3번 정도 다시 읽고 나서야 제 정신이 들었던 것 같습니다.

 

데이터 분석에 관심을 가지게 된 계기나 데이터 분석 일을 하게 된 이유가 있다면 무엇인가요?

빅데이터라는 단어가 2012년쯤부터 화두가 되었던 걸로 기억합니다. 이 때 언론에서 빅데이터, AI 등의 키워드가 자주 다루어 지면서 자연스레 관심을 갖게 되었습니다. 방대한 양의 데이터를 바탕으로 미래를 예측한다라는 점이 그 당시에 가장 매력적으로 다가왔고, 그렇기 때문에 지속적으로 흥미를 가지고 데이터 분석을 공부하게 되었습니다.

 

 

데이콘 경진대회에 참여한 동기가 있나요?

 

데이터 과학 관련해서 구글링을 하다가 우연히 Dacon에 대해 알게 되었습니다. 한국에도 Kaggle과 같은 데이터 경진대회 플랫폼이 있다는 것을 알게 되어 기뻤고, 하루라도 빨리 대회가 열리면 참여를 하고 싶은 생각이 들었습니다. 마침 6차 대회, 7차 대회가 열렸고, 해당 대회들을 차례로 참여하게 되었습니다.

 

 

학업이나 현업 그리고 일상생활과 관련해서 대회 중 느낀 점이 있다면 무엇입니까?

 

데이터 과학자에게 필요한 역량을 요약한 “데이터 사이언스 벤다이어그램” 이란 것이 있습니다. 다양한 버전들이 존재하는데, 공통적으로 등장하는 역량들이 수학 및 통계학에 대한 지식, 프로그래밍 지식, 그리고 도메인 지식입니다. 이 그림을 처음 접했을 때 저는 상대적으로 도메인 지식에 대해서는 등한시 하였습니다. 도메인 지식 보단 모델을 이해하고 적용하는데 직접적인 도움을 주는 수학/통계학/프로그래밍이 더 중요하다고 생각했기 때문입니다. 허나 본 대회를 진행하면서 도메인 지식 또한 그 외의 지식 못지 않게 정말 중요하다는 것을 느꼈습니다.

본 대회는 다른 대회처럼 평가지표(evaluation metric)가 주최측에 의해서 고정 된 것이 아니었습니다. 즉 참가자가 직접 투수를 평가하는 기준을 세워야 했었습니다. 저 같은 경우 평소 야구를 즐겨보는 편은 아니라서 본 대회에 참가하기 위해 야구 관련 기사들을 읽고, 야구 지표들에 대해 공부하고, 또한 주변 지인들에게 야구에 대해 물어보는 과정에 시간을 많이 투자하게 되었습니다. 이러한 과정이 있었기에 투수를 평가하기에 적합한 기준을 세울 수 있었던 것 같습니다. 그렇기 때문에, 특정 문제를 해결하기 위하여 적합한 접근방법을 생각해내기 위해서는 해당 도메인에 대한 풍부한 지식이 필요하다는 것을 본 대회를 통해 느꼈습니다

 

 

대회에 참여하면서 어려웠던 점이 있다면 무엇일까요?

 

학교를 다니면서 대회에 참여를 하다 보니, 아마 가장 어려웠던 점은 일정 관리 인 것 같습니다. 대회 제출 기간 중에 중간고사 기간이 겹쳐 있어서, 중간 고사 준비와 대회를 병행하는 것이 가장 어려웠습니다.

 

 

데이콘에 더 바라는 점, 기대 사항이 있다면 무엇입니까?

 

Dacon이라는 훌륭한 국내 데이터 경진대회 플랫폼이 존재하는데, 이것을 아직 많은 사람들이 모르고 있다는 점이 아쉽습니다. 뿐만 아니라 캐글처럼 플랫폼 내에서 활발한 discussion 또한 이루어지고 있지 않는 점이 아쉽습니다. 그래서 저는 사용자 입장에서 플랫폼의 사용자 수 증가 및 플랫폼 활성화 방안에 대해 제 나름대로 생각한 것을 공유하고 싶습니다.

앞으로도 좋은 대회 많이 호스팅 부탁드립니다.