2022 AI 대학원 챌린지

LG | 채용 | B-cell | Epitope | Classification | macro-f1

  • moneyIcon 상금 : 총 2,500만원
  • 304명 마감

 

[Private 0.68251 하찌아빠팀] part 01. feature engineering

공동작성자

stroke
2022.08.01 20:28 986 조회 language

3일 만에 모든 것을 뒤집기는 쉽지 않네요. 

Protein을 분석할 수 있는 python library를 최대한 많이 조사하여 data driven learning을 시도했습니다.

part 01. 에서는 990여가지의 feature를 생성하는 코드를 공유해드립니다. 

코드
로그인이 필요합니다
0 / 1000
10duck
2022.08.01 20:32

이후 feature들을 제곱 또는 역수를 취하거나 feature들 끼리 곱하는 다양한 형태의 추가 작업을 시행했습니다.

그리고 역수를 취했을 때 label과 상관계수가 가장 높게 나왔습니다. 

따라서, feature들을 역수로 넘기고 데이터 셋에 포함하는 과정만 공유드리는 코드에 담았습니다.