항공사 고객 만족도 예측 AI 해커톤

정형 | Accuracy

  • moneyIcon 상금 : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 657명 마감

 

각 Feature에 좀 더 신경써보자! 현재 점수 코드! [public : 0.938]

2022.02.12 21:41 1,485 조회 language

다른 분들이 먼저 올려주신 훌륭한 코드를 조금씩 참고하고 제 생각을 가미해서 진행해보았습니다.

제가 한 코드에 대한 요약입니다.

- 이산형, 범주형 Feature들은 값별로 몇개씩 있는지, 만족비율은 어떻게 되는지 확인

- zero_feat = ['Seat comfort', 'Food and drink', 'Inflight entertainment', 'Leg room service']
→ 저도 마찬가지로 0인데 만족한 경우에 대해서 의문을 가졌는데 
그런 경우 저는 귀찮아서 대충 체크를 하나로 했을 수 있을거라 생각해서 
0을 가진 피쳐들끼리 비교를 진행하여 둘 다 0일 경우에 집중해보았습니다. 
나름대로 생각해서 파생변수를 만들었지만 안건드는게 제일 점수가 가장 높아서 속상합니다...

- 나이 : 10대, 20대, 30대, ... 로 범주를 나눠 피쳐를 구분했습니다.

- 출발 딜레이, 도착 딜레이 : 
처음에는 출발 딜레이가 크게 존재하면 도착 딜레이가 존재하겠구나 생각하고 만족도에 많은 영향을 주겠다 생각했는데, 
출발 딜레이와 도착 딜레이를 비교 해보니 한 쪽은 0인데 몇 분씩 늦은 행들이 있어 
저는 두 피쳐의 평균만을 사용했습니다.

- 모델링은 pycaret으로 진행하였고, 하이퍼 파라미터 조정은 진행하지 않았습니다.

하이퍼 파라미터 조정을 통해 점수를 좀 더 올리기위해 노력할 예정입니다.

ps. https://wannabenice.tistory.com/ 제 블로그에도 글을 올릴 예정이니 관심있게 봐주시면 감사하겠습니다.

코드