월간 데이콘 천체 유형 분류 대회

알고리즘 | 정형 | 분류 | 과학 | LogLoss

  • moneyIcon 상금 : 154만원
  • 1,221명 마감

 

[2등][JY!] 코드 공유

2020.03.08 14:27 8,662 조회 language

다들 고생하셨어요!
모든 작업은 코렙에서 진행했습니다. 

분석과정
 
변수 생성
- 각 파장에서의 밝기 차이를 구한 diff 변수가 가장 주요했습니다.

모델 학습
- 여러 변수를 대회 막바지에 생성했는데, 변수 선택의 여유가 없었고, 
- 각 데이터셋마다 fold별로 logloss 값의 순위 변동이 있어서 예측 결과를 스태킹하였습니다. ( + 일반화를 위해 2개 seed에서 학습해서 평균)

스태킹 & 앙상블
- cv가 안정적이라 최대한 점수를 내기 위해 스태킹과 앙상블을 병행했습니다.

코드
로그인이 필요합니다
0 / 1000
DACONIO
2020.03.09 00:04

감사합니다.

사과통수
2020.04.01 17:16

'train,test의 분포 차이' 두번째 줄에서
ValueError: invalid number of arguments 에러가 뜨는데 확인 가능하신가요?ㅠㅠ

낙지
2020.04.17 23:26

np.logical_and() 연산자가 두개의 조건을 받아야 하는데 이상치를 처리하는 코드인 것 같은데 저도 지금 여기서 어떻게 처리하는지 궁금하군요. 이거 때매 오류가 발생한거 같아요

낙지
2020.04.17 23:36

아앗 찾았습니다. test 데이터를 기준으로 train의 이상치를 자르는 코드인 것 같네요.

df = train[[col]].loc[np.logical_and(train[col]test[col].min())]
 
테스트의 최소값과 최대값 밖으로 나가는 train의 값들을 날려주는 코드인 것 같군요.

낙지
2020.04.18 02:46

변수생성전까지  딱 봤는데 이 발상을 도대체 어떻게 한건지 궁금하네요.. 보는 내내 감탄하면서 갑니다.

novicecoder
2023.02.01 16:50

안녕하세요 코드 잘 봤습니다
저도 해보고 싶어서
데이터를 다운받으려고 했는데
에러가 떠서
혹시 가지고 계시다면
보내주실 수 있나요?

이전 글
이전 글이 존재하지 않습니다.
현재 글
[2등][JY!] 코드 공유
대회 - 월간 데이콘 천체 유형 분류 대회
좋아요 15
조회 8,662
댓글 6
5년 전
다음 글
[1등][처음해봐요] LightGBM Dart Single
대회 - 월간 데이콘 천체 유형 분류 대회
좋아요 22
조회 17,596
댓글 25
5년 전