월간 데이콘 천체 유형 분류 대회

[3등][taegu]Xgboost_gpu

2020.03.01 13:05 7,765 Views language

모든 과정은 colab을 통해 진행했습니다.
 
변수 생성
- 기존 변수에 대해 사칙연산을 통해 유의미한 변수를 발견했습니다.
- fIberID를 변형하여 유의미한 변수를 만들었습니다.


모델 학습
- 클래스가 불균형하여 파라미터에 매우 민감했다고 생각합니다.
- 다른 모델의 성능이 좋지않아 스테킹 및 앙상블의 성능이 좋지 않았고 다른 모델에 신경쓰지 못한 부분이 아쉽습니다.

Code
로그인이 필요합니다
0 / 1000
SDSTony
2020.03.01 14:23

소중한 인사이트 공유 감사드립니다. EDA 및 설명글이 잘 정리 되있어서 시각화 그림 보면서 이해하기 편했습니다. 

taegu
2020.03.02 07:28

감사합니다 ㅎㅎ

JunHoLim
2020.03.01 15:27

공유 감사합니다.

taegu
2020.03.02 07:28

수고하셨습니다~

당쇠
2020.03.01 15:44

공유 감사합니다.

taegu
2020.03.02 07:28

수고하셨습니다~

처음해봐요
2020.03.01 17:23

감사합니다~ 잘 배웠습니다.

taegu
2020.03.02 07:28

저도 솔루션 잘 봤습니다 ㅎㅎ 감사합니다

호구너
2020.03.02 02:43

감사합니다!

taegu
2020.03.02 07:28

수고하셨습니다!! ㅎㅎ

Kerry
2020.03.08 16:32

감사합니다. 다만 질문을 드리고싶은부분이있습니다. 파생변수를 사칙연산으로 생성하셨는데 이는 plot을 다보시고 경향성을 보시고 하신작업인가요?
그리고 feature importance를 보고 변수를 제거할때 어떤 기능의 feature importance를 사용하셨는지 혹시 알수있을까요? 상당히 많은변수들인데 한번에 제거하셨다는 방법이궁금합니다..

taegu
2020.03.08 21:03

모든 변수를 직접 볼 수 없어 경향만 보고 기존 변수인 20개 변수에 대해 모든 경우의 수를 함수를 통해 사칙연산을 해주었습니다.
코드에 20개의 모든 변수에 대해 -를 해주는 코드가 있습니다.

feature importance의 경우 tree모델의 importance계수로 휴리스틱하게 뽑았습니다.

Kerry
2020.03.09 15:57

성심있는 답변 감사합니다. tree모델의 importance계수라면 예를들면 XGBOOST의 plot_importance와같은 것을 말씀하시는거 맞나요?

DACONIO
2020.03.09 00:06

수고하셨어요~

taegu
2020.03.09 10:04

감사합니다 ㅎㅎ

CRISPR
2020.03.30 19:37

# corr 기준으로  0.15이상 -0.1이하의 변수를 선택했습니다.
이부분은 혹시 mag_z 와 mag_u 의 상관계수가 일정이상 큰것끼리 골라 division 연산을 수행해주신건가요?
혹시 왜 상관관계가 있는 것끼리 그런 선택을 하셨는지 여쭤봐도될까요?

사과통수
2020.04.05 02:37

2. 데이터 전처리 remove_outlier() 함수 정의 부분 코드가 조금 수정이 필요할 것 같은데 맞게 본 걸까요?

taegu
2020.04.16 08:29

안녕하세요 늦어서 죄송합니다. 어디부분이 이상한가요?

지구본으로지구를
2020.04.15 18:59

안녕하세요 질문이 있습니다. parameter를 설정해줄때 혹시 노하우가있으신가요? 

taegu
2020.04.16 08:59

트리모델의 경우 기본적으로 성능을 내는 parameter가 있고 그 후 휴리스틱하게 바꾸면 편입니다.

이번에 스타2대회에 올라온 베이지안최적화 알아보시는 것도 좋은거같습니다!

지구본으로지구를
2020.04.15 22:47

quantile 부분 함수에서 좀 에러가 있는거 같은데 한번 봐주실수있나요 저는 결과가 아무것도 안나오네요 

taegu
2020.04.16 08:31

코드실행결과 저는 잘 작동합니다. ㅠㅠ
실행 전 eda.describe()와
실행 후 eda.describe()를 비교해보시겠어요?

novicecoder
2023.02.07 11:51

삭제된 댓글입니다