분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제주 신용카드 빅데이터 경진대회
소비자 정보 관련 변수
소비자 관련(성별, 가구 생애주기) 변수 또는 이용고객수 (명)
이런 변수들은 최종적으로 test데이터로 예측할 때 사용할 수가 없는데 왜 들어간 것일까요?
하지만 test_data는 없는 변수이기 때문에 활용을 못하지 않을까 싶습니다 :(
소비자, 이용 고객수도 시계열로 분석을 통해 예측해서 파악해야하는 것일까요
네, 이용 고객수는 모르는 값이라 직접적으로 사용하기 어려울 것 같습니다.
시계열로 예측해서 사용하는 것도 좋은 방법일 것 같고 그게 아니더라도 인사이트를 얻는데 유용할 것 같습니다.
성별, 가구 생애주기 등 소비자 정보는 예측할 필요가 없다고 생각합니다.
일정 구간으로 나뉘어 있는 값이기 때문에 베이스라인처럼 모든 값이 다 있다고 가정해도 이상해 보이지 않습니다.
오 데이터에 대해 완벽하게 이해됐습니다. Train에서 잘만 insight 찾으면 test에서 충분히 변수로 다 만들 수 있겠네요. 도움 정말 감사합니다
저도 답변 달면서 정리가 되었습니다. 감사합니다~
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
소비자 관련 정보도 예측시 중요한 변수가 될 것 같아요. 아직 데이터를 자세히 보지는 못했지만 소비자, 이용 고객수 등은 큰 변화가 있는 값은 아닐 겁니다. 소비자 수는 예측하려는 총 사용량과 관련있는 중요한 정보로 이를 얼마나 잘 사용하느냐에 따라 모델 성능이 다를 것 같아요.