서두르세요! "데이스쿨 40% 할인" 12월 2일까지!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 0.68251 하찌아빠팀] part 01. feature engineering
공동작성자
3일 만에 모든 것을 뒤집기는 쉽지 않네요.
Protein을 분석할 수 있는 python library를 최대한 많이 조사하여 data driven learning을 시도했습니다.
part 01. 에서는 990여가지의 feature를 생성하는 코드를 공유해드립니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
이후 feature들을 제곱 또는 역수를 취하거나 feature들 끼리 곱하는 다양한 형태의 추가 작업을 시행했습니다.
그리고 역수를 취했을 때 label과 상관계수가 가장 높게 나왔습니다.
따라서, feature들을 역수로 넘기고 데이터 셋에 포함하는 과정만 공유드리는 코드에 담았습니다.