항공사 고객 만족도 예측 AI 해커톤

정형 | Accuracy

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 682명 마감

 

범주형 데이터를 활용한 `class` 별 성능 비교 실험(public: 0.931)

2022.02.13 23:30 2,967 Views language

안녕하세요.
이번 코드는 기존 데이터는 보다 간소화하고, 일상적인 아이디어를 실험으로 검증해보려 진행한 코드입니다.
수행한 내용은 간단히,
1. 모든 변수를 범주형 변수로 변경할 것(간소화)
2. 일반적으로 비행기의 만족도와 비례한다고 볼 수 있는 `class` 변수에 따라 어떤 예측 성능이 나오는지 비교할 것
입니다.

2번의 경우, 통계적으로도 접근할 수 있겠지만, 저는 모델로 접근을 해보았습니다.
통계치보다, 조금 더 어떻게 접근하는 것이 더 나은 성능을 갖게 만들 수 있는지 와 닿는것 같네요.
다른 분들에게도 도움이 되는 결과였으면 합니다.

본 포스팅은 데이콘 서포터즈 "데이크루" 1기 활동의 일환입니다.

Code