월간 데이콘 신용카드 사용자 연체 예측 AI 경진대회

알고리즘 | 정형 | 분류 | 금융 | LogLoss

  • moneyIcon Prize : 100만원
  • 3,765명 마감

 

[데이터] 데이터 변수 설명

2021.03.29 11:32 15,302 Views

안녕하세요. 데이콘입니다.


데이터 변수 설명


  • index
  • gender: 성별
  • car: 차량 소유 여부
  • reality: 부동산 소유 여부
  • child_num: 자녀 수
  • income_total: 연간 소득
  • income_type: 소득 분류

['Commercial associate', 'Working', 'State servant', 'Pensioner', 'Student']

  • edu_type: 교육 수준

['Higher education' ,'Secondary / secondary special', 'Incomplete higher', 'Lower secondary', 'Academic degree']

  • family_type: 결혼 여부

['Married', 'Civil marriage', 'Separated', 'Single / not married', 'Widow']

  • house_type: 생활 방식

['Municipal apartment', 'House / apartment', 'With parents',

'Co-op apartment', 'Rented apartment', 'Office apartment']

  • DAYS_BIRTH: 출생일

데이터 수집 당시 (0)부터 역으로 셈, 즉, -1은 데이터 수집일 하루 전에 태어났음을 의미

  • DAYS_EMPLOYED: 업무 시작일

데이터 수집 당시 (0)부터 역으로 셈, 즉, -1은 데이터 수집일 하루 전부터 일을 시작함을 의미

양수 값은 고용되지 않은 상태를 의미함

  • FLAG_MOBIL: 핸드폰 소유 여부
  • work_phone: 업무용 전화 소유 여부
  • phone: 전화 소유 여부
  • email: 이메일 소유 여부
  • occyp_type: 직업 유형
  • family_size: 가족 규모
  • begin_month: 신용카드 발급 월

데이터 수집 당시 (0)부터 역으로 셈, 즉, -1은 데이터 수집일 한 달 전에 신용카드를 발급함을 의미

  • credit: 사용자의 신용카드 대금 연체를 기준으로 한 신용도

=> 낮을 수록 높은 신용의 신용카드 사용자를 의미함


감사합니다.

데이콘 드림




로그인이 필요합니다
0 / 1000
은둔초보
2021.04.05 20:05

FLAG_MOBIL: 핸드폰 소유 여부
phone: 전화 소유 여부
이 두 변수는 어떤 차이가 있는 건가요?

DACONIO
2021.04.06 09:03

안녕하세요 7살님

FLAG_MOBIL은 핸드폰 소유 여부

phone 은 가정용 전화 소유 여부를 의미합니다.

감사합니다.

데이콘 팀 드림

닥스훈트
2021.04.07 03:20

credit 변수에 대한 설명이 잘 이해되지 않아 질문 드립니다.

[credit: 사용자의 신용카드 대금 연체를 기준의 신용도]

즉, 기존에 사용하던 연체 예측 알고리즘에 의해 선정된 신용도란 뜻일까요?

아니면 실제로 연체가 발생하여 데이터로 제공되지는 않았지만 연체 횟수, 연체 금액에 따라 부여된 등급일끼요??

 

DACONIO
2021.04.07 09:11

안녕하세요 닥스훈트님. 

데이콘입니다.

예 그렇습니다. 

사용자의 실제 신용카드 연체 일수,  횟수 등에 따라 부여된 등급입니다.

감사합니다.

망고54
2021.04.07 16:03

출생일, 업무시작일, 신용카드 발급월 항목의 기준인 '데이터 수집 당시' 가 언제인지 알 수 있을까요

DACONIO
2021.04.07 16:27

안녕하세요 망고54님 

말그대로 데이터 수집 당시 기준으로 

예를 들어 신용카드 발급월이 -5인 사용자면

'이 사용자가 신용카드를 발급한지 5달 되었구나'라고 생각하시면 됩니다.

감사합니다.

embiid3
2021.04.08 15:25

income_type 변수의 'Commercial associate'과 'State servant'는 어떤 것을 말하는 건가요

마공빅토르
2021.04.09 14:25

begin_month 변수의 값이 1이상인 양수인 경우가 있는데 이 경우에 대해 정의가 따로 있는건가요?

somsom
2021.05.10 11:34

train, test 에도 begin_month 에서 값은 0보다 작거나 같은 값들인데, 혹시 1이상의 값을 어디서 찾으신건가요??

August.S
2021.04.16 13:22

DAYS_EMPLOYED 변수의 업무 시작일 이라는 게 무슨 말인지 잘 와닿지 않는데 최초 취업후 기간 정도로 해석이 되나요? 

DACONIO
2021.04.19 11:50

안녕하세요 영진해변님 

이해하신 방식으로 최초 취업 후 기간으로 생각하시면 됩니다.

감사합니다.

데이콘 팀 드림

Icewine
2021.04.16 15:31

기준이 되는 컬럼이 있을까요? 예를 들어 같은 사용자가 존재한다면 같은 사용자라고 인식할 수 있는 컬럼(이름이나 같은 index number 등)

DACONIO
2021.04.19 11:52

안녕하세요 Icewine님

제공된 데이터에서 같은 사용자여도 index는 다를 수 있습니다. (ex) 같은 사람이 복수의 카드를 발급할 경우)

이 점 참고하여 대회 참여해주시면 감사하겠습니다.

감사합니다.

데이콘 팀 드림

eunjikim
2021.04.19 17:36

연간소득 변수의 단위가 어떻게 될까요?

DACONIO
2021.04.27 09:53

안녕하세요 eunjikim님 

데이콘입니다.

문제 제작 과정에서 변수들을 가공했기에 상대적인 지표로 판단해주시면 감사하겠습니다.

감사합니다.

데이콘 팀 드림

김한규
2021.04.26 15:22

family_type 에서 married와 civil_marriage 어떻게 다른지 궁금합니다.

비온데이
2021.05.10 14:54

결혼과 사실혼(=동거) 인 듯 합니다.

dmadmadma
2021.04.26 23:52

['Higher education' ,'Secondary / secondary special', 'Incomplete higher', 'Lower secondary', 'Academic degree']
교육 수준이 이 순서로 심화되는 건가요?

DACONIO
2021.04.27 09:55

안녕하세요 데이콘입니다.

데이터 변수 설명 외 데이터의 도메인 지식에 관해서는 답변해드릴 수 없다는 점 양해 부탁드립니다.

도메인에 대한 탐색은 검색 및 토론 게시판을 이용해주시면 감사하겠습니다.

감사합니다.

데이콘 팀 드림

장용
2021.04.30 13:13

occyp_type 에서 null값은 직업이 없다고 봐야하는 건가요?

깍구
2021.05.04 10:51

안녕하세요. 이번에 이 대회에 참여하게 되었는데 credit 의 등급에 대해 의문점이 있어 질문드립니다.

이 데이터에서 0이 신용등급이 높다는 뜻은, 통상적인 말로 연체불량등급이 높다는 뜻인가요? 

통계 자료를 보면 연체 이행률이 훨씬 높습니다. 하지만 데이터에선 신용등급이 0(가장 높은) 사람비율이 가장 적은 것을 보고 워딩이 애매하다 생각되어 질문드립니다.