DASCHOOL Discount Returns!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 0.68251 하찌아빠팀] part 01. feature engineering
3일 만에 모든 것을 뒤집기는 쉽지 않네요.
Protein을 분석할 수 있는 python library를 최대한 많이 조사하여 data driven learning을 시도했습니다.
part 01. 에서는 990여가지의 feature를 생성하는 코드를 공유해드립니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
이후 feature들을 제곱 또는 역수를 취하거나 feature들 끼리 곱하는 다양한 형태의 추가 작업을 시행했습니다.
그리고 역수를 취했을 때 label과 상관계수가 가장 높게 나왔습니다.
따라서, feature들을 역수로 넘기고 데이터 셋에 포함하는 과정만 공유드리는 코드에 담았습니다.