분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[2등][JY!] 코드 공유
다들 고생하셨어요!
모든 작업은 코렙에서 진행했습니다.
분석과정
변수 생성
- 각 파장에서의 밝기 차이를 구한 diff 변수가 가장 주요했습니다.
모델 학습
- 여러 변수를 대회 막바지에 생성했는데, 변수 선택의 여유가 없었고,
- 각 데이터셋마다 fold별로 logloss 값의 순위 변동이 있어서 예측 결과를 스태킹하였습니다. ( + 일반화를 위해 2개 seed에서 학습해서 평균)
스태킹 & 앙상블
- cv가 안정적이라 최대한 점수를 내기 위해 스태킹과 앙상블을 병행했습니다.
'train,test의 분포 차이' 두번째 줄에서
ValueError: invalid number of arguments 에러가 뜨는데 확인 가능하신가요?ㅠㅠ
np.logical_and() 연산자가 두개의 조건을 받아야 하는데 이상치를 처리하는 코드인 것 같은데 저도 지금 여기서 어떻게 처리하는지 궁금하군요. 이거 때매 오류가 발생한거 같아요
아앗 찾았습니다. test 데이터를 기준으로 train의 이상치를 자르는 코드인 것 같네요.
df = train[[col]].loc[np.logical_and(train[col]
테스트의 최소값과 최대값 밖으로 나가는 train의 값들을 날려주는 코드인 것 같군요.
변수생성전까지 딱 봤는데 이 발상을 도대체 어떻게 한건지 궁금하네요.. 보는 내내 감탄하면서 갑니다.
안녕하세요 코드 잘 봤습니다
저도 해보고 싶어서
데이터를 다운받으려고 했는데
에러가 떠서
혹시 가지고 계시다면
보내주실 수 있나요?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
감사합니다.