따릉이 대여량 예측 AI 해커톤

따릉이 대여량 코드 공유(Public : 0.32476, Private : 0.25052)

2021.11.13 22:09 4,315 조회 language

따릉이 대여량 코드 공유합니다.! 처음으로 참가해본 대회이고 public score가 아쉬워서 Private에 대해 크게 기대하진 않았는데 Private에서 좋은 성적을 얻게 되어 제가 어떻게 접근해보았는지 공유하고자 합니다. 대회 기간동안 올려주신 코드 공유 내용을 바탕으로 여러 Insight을 반영해 보았고, 제 스스로 생각해본 내용도 추가 반영하여 예측 시도해보았습니다. 부족한 부분이나, 건설적인 피드백, 질문은 언제나 환영합니다. 감사합니다:)

- 사용 모델 : XGBoost (Depth = 4)

코드
로그인이 필요합니다
0 / 1000
빅슈님
2021.11.13 23:22

코딩, 쓰신 언어 정말 초보자를 잘 배려하신것 같습니다.  특히 행간에 비약과 생략이 없어서 좋았습니다.
그럼 참고삼아서 공부를하러..ㅎ

다람이도토리
2021.11.14 13:09

피드백 감사합니다..! 저도 데이터 분석 자체를 많이 해보지는 않았기에, 오히려 조금 더 꼼꼼하게 써보려고 노력하게 되는 것 같습니다..

하비비
2021.11.14 17:23

feature를 혼합해서 또 다른 feature를 만들어내면 성능이 좋아지는 군요.. 
Linear regression 모델과 XGboost 모델에 대한 내용도 잘 봤습니다!

다람이도토리
2021.11.14 17:57

감사합니다.! 아무래도, feature 단일로는 외부적인 상황의 의미를 다 담기는 어려운 것 같아서, feature간 조합이 필수적인 것 같습니다.

mkk4726
2021.11.15 17:19

feature engineering 단계에서 새로운 feature를 추가하는거는 생각못했었는데, 좋은 정보 감사합니다!

다람이도토리
2021.11.15 20:08

감사합니다. 아무래도, 단일 변수로는 못 담는 정보들이 많으니까요. 특히 기후라는거는, 사람이 느끼는것과 수치적인 부분은 다르니까요.