KB금융그룹 문자 분석 경진대회의 수상자가 가려졌습니다.

2020.02.08 08:41 2,288 Views

KB금융그룹 문자 분석 경진대회의 수상자가 가려졌습니다.

수고하셨습니다. 코로나 때문에 아쉽게 시상식은 열리지 못했지만

데이콘에서 2주 후 밋업을 개최할 예정입니다.


참여 통계

참여팀: 438 팀, 참여인원: 960 명, 파일 제출 횟수: 6,349 회


우승자 점수

팀명 | AUC | 예측시간 | 점수 | 상금

스팸구이 | 0.999405 | 6.8 | 1.3 | 1000

Jhw | 0.999058 | 7.5 | 3.0 | 500

지주 | 0.998289 | 16.8 | 5.3 | 250

Start Over | 0.9992 | 3186.0 | 5.9 | 100

곱창전골저아 | 0.998474 | 109.4 | 6.1 | 50

곰다리 | 0.997967 | 9.8 | 6.1 | 50

김웅곤 | 0.997991 | 235.3 | 8.1 | 50

> 리더보드 바로가기


의의

대회 참여 인원은 총 960명으로 국내에서 가장 많은 사람이 참가한 데이터 경진대회로 성황리에 마무리되었습니다. 많은 사람이 참여한 이유로는 1. 기존 데이콘 회원의 높은 참가율 2. 높은 상금 (총 2,000 만원) 3. KB금융, 한국인터넷진흥원(KISA)의 높은 브랜드 가치인 것으로 판단됩니다. 알고리즘 평가를 위해서 대회 중 새롭게 수집한 11월 ~ 12월 금융 문자 데이터에 대해 예측력과, 예측 시간을 측정했습니다. 많은 우수 코드들은 공통적으로 형태소 분석기로는 Mecab을 사용했으며 머신러닝 모델로는 LightGBM을 사용했습니다. 대회 특성상 정확도와 함께 예측 속도가 중요하기 때문에 정확하면서도 처리시간이 짧은 Mecab이 선택되었고, 길이가 짧은 금융문자 특성상 신경망 기반의 BERT, LSTM과 같이 무거운 모델 보다는 비교적 가벼운 LightGBM이 선호된 것으로 보입니다. 대회 결과 높은 예측력을 보이면서도 속도 또한 빠른 알고리즘을 발굴할 수 있었습니다. 이로써 실시간으로 스미싱 문자 분석이 가능할 것으로 기대됩니다.



datavisualization DataScience DataAnalyst DataEngineer DataScientist MachineLearning deeplearning 데이터분석 인공지능 머신러닝 딥러닝 파이썬 코드 공유 AI python 통계 수학