분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[주의] 기존 베이스라인 코드 수정 및 data leakage 규칙 설명
안녕하세요. 데이콘입니다.
신용카드 사용자 연체 예측 AI 경진대회는
신용카드 사용자 데이터를 보고 사용자의 대금 연체 정도를 예측하는 알고리즘을 개발하는 경진대회입니다.
참가자분들은 train 데이터로 모델을 학습시킨 뒤, test 데이터의 반응 변수를 예측하는 알고리즘을 만들어 결과물을 제출해주시면 되며,
이 과정에서 test 셋은 "아예 모른다고 가정"하고 학습을 진행해주셔야 합니다.
모델 학습에서 검증 혹은 평가 데이터셋을 활용할 시 해당 참가자는 실격처리됩니다.
다만, 저희 데이콘 측에서는 이러한 저희의 규칙에도 불구하고
기존 베이스라인 코드에서 전처리 하는 과정 중 test set을 fit하는 실수를 범했기에 이를 알려드리며,
많은 참가자 분들께 혼란을 드린 점에 사과의 말씀을 전합니다.
아울러, 베이스라인 코드를 수정했음을 공지드리며
참가자 분들께서도 대회 참여하면서 놓칠 수 있는 data leakage 규칙을 다시 한 번 상기하시길 바랍니다!.
신용카드 사용자 연체 예측 AI 경진대회를 참가해주시는 많은 분들께
다시 한 번 혼란을 드려 죄송하다는 사과의 말씀을 전합니다.
감사합니다.
데이콘 드림
[기존 베이스라인의 규칙 위반 사례 예시]
설명: test data를 전처리 과정에서 fit_transform 시킴
[수정 예시]
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
아이구...