영화 관객수 예측 경진대회

정형 | 알고리즘 | 중급

  • moneyIcon Prize : 교육
  • 4,326명 D-11

 

score : 493643.24145 / 그냥 한번 끄적여봅니다....

2021.05.20 17:40 11,858 Views language

심심하여 점심 먹고 한번 해봤습니다
사실 스코어가 저렇게 나올수 있나 싶어서 문제점이나 오류가 있으면 말씀을 듣고자 올려봅니다....

미리 감사합니다!

Code
로그인이 필요합니다
0 / 1000
팝팝
2021.05.20 17:47

오 1등 갱신이네요! 축하드려요 ㅎㅎ

shki
2021.05.21 19:14

교육용 대회이긴 하지만 뿌듯하긴 하네요 ㅎㅎㅎㅎ감사합니다!

촉촉한초코칩
2021.05.20 18:48

음 제 눈에는 문제는 없어 보입니다.
축하드립니다!

shki
2021.05.21 19:14

자세히 봐주셔서 감사합니다!

pyoh.amen
2021.05.21 11:58

꼼꼼하게 잘 하셨네요 ㅎㅎ

shki
2021.05.21 19:15

아직 갈길이 너무 머네요 ㅎㅎㅎ 감사합니다

어우두야
2021.07.13 17:42

전처리방법이랑 앙상블 방법 정말 도움 많이 받고 있습니다.  감사합니다.
한가지 궁금한건 어떤걸 주로 로그로 변환하시나요?? 검색해보면 격차(?) 가 많이 나는것들을 로그 씌운다던데... 어느정도가 격차가 큰건지 잘 모르겠네요...
이것저것 다 해보는건가요? 

shki
2021.07.14 17:48

도움이 되셨다니 다행이네요 ㅎㅎㅎ 질문에 답을 드리자면 변수의 값의 분포(왜도 : skewness)가 극단적으로 치우친 경우 저는 주로 로그변환을 해줍니다! 로그 변환을 위한 왜도 기준점은 경험적으로 정하는 것 같습니다 ㅎㅎㅎ 정해진 것은 없는 것 같네요 다만 왜도가 0일 때 데이터가 정규분포를 띈다는 점만 유념합니다 ㅎㅎ 무조건 적으로 성능 개선을 보장하는 것은 아니라서 말씀해주신 것 처럼 다른 여러 작업들과 병행하는 것이 중요한 것 같습니다 

tnsenqnd
2022.07.28 18:22

혹시 왜도를 확인한게 어느코드인가요?

히미니
2021.09.10 19:33

공부에 많은 도움이 되었습니다. 감사합니다!
궁금한 점이 있는데 결측치를 전부 0으로 처리한 이유가 있을까요? 특히 test의 num_rank 결측치를 왜 0으로 하신건지 궁금합니다.
감사합니다.

shki
2021.09.17 19:23

결측치 처리는 아시다시피 여러 방법이 있을텐데 num_rank 변수가 배급사 파워(?)를 의미하도록 만들었기 때문에 등장한적 없던 배급사(결측치)는 0으로 처리했습니다!

우진
2021.09.16 18:18

안녕하세요 기세현님!
공유해주신 코드로 정말 많은 공부와 도움이 되었습니다. 진심으로 감사드립니다.

혹시 공유해주신 코드 바탕으로 공부한 내용, 수정해본 내용을 토대로
블로그 포스팅에 사용해도 될까요?

공유해주신 코드 링크와 출처는 명확하게 밝히겠습니다.

shki
2021.09.17 19:22

답글이 늦어 죄송합니다 ㅠㅠㅠ 네 얼마든지 사용하셔도 됩니다!

우진
2021.09.17 20:48

감사합니다 !!!

냥낭펀치
2021.09.18 11:09

감사합니다 기세현님.
저같은 왕초보에겐 이런 코드 공유가 실력향상에 큰 힘이 됩니다.

궁금한게 있는데 이러한 코드들은 어디서 배우셨나요?
대학교에서 AI경진대회를 주최해서 참여했는데 "이렇게 예측하면 되겠다"는 플랜은 다세웠는데 막상 코드를 몰라서
대회에 제출할 코드가 하나도 없네요 ㅠㅠ
코드 공부를 어떻게, 어디서 하셨는지 너무 궁금합니다.

🇰🇷🇹🇼🇳🇮🇬🇺🇳🇫
2021.09.29 11:06

👏

jee_p0
2021.10.02 09:50

좋은 코드 공유 감사합니다^^

dnwk
2021.10.02 16:14

멋져용

ForestUp
2021.11.30 17:40

많이 공부하고 갑니다..

차차차차차
2021.12.21 13:31

대단하십니다 .. 공부 어떻게 하셨나요 ? ㅠ 멋지세요

Owenlee
2021.12.21 15:35

정말 훌륭한 코드인데 공유해주셔서 감사합니다.

한가지 질문이 있는데 6가지 모델이 도출한 결과값을 평균내서 제출하면 
장점과 단점이 존재할 것같은데 어떠한 장단점이 존재할까요?

pidy
2022.01.10 15:21

좋은 코드 감사합니다~

tnsenqnd
2022.07.22 18:58

잘보고갑니다 감사합니다

Wooong
2022.07.22 23:31

교차검증까지 너무 좋은거같아요! 감사합니다~