제1회 신약개발 AI 경진대회

알고리즘 | 분자 구조 | 정형 | 회귀 | 바이오 | RMSE

  • moneyIcon 상금 : 2,900만원
  • 1,685명 마감

 

pycaret을 이용한 코드 PB : 28.3010771222

2023.09.13 17:35 3,074 조회 language

pycaret을 이용한 코드입니다. smiles 표현식에서 추출할 수 있는 모든 feature를 사용하여 tree 계열 알고리즘만 pycaret을 이용했습니다.
기본적으로 feature를 더 뽑을 수록 tree 계열이라서 좀수 향상이 있었습니다. 하지만 지금이 한계인듯하네요.
pretrained 모델도 이용해복 GNN도 이용해봤지만 smiles 표현식에서 feature를 뽑아낸게 가장 성능이 좋네요.
저보다 점수 높은 분들은 어떤식으로 했는지 궁금하긴하네요.

코드
로그인이 필요합니다
0 / 1000
건조한안구는싫어
2023.09.13 19:42

매번 잘 보고 있습니다. 감사합니다.

주머니쥐
2023.09.14 10:37

혹시 중복치를 최대값으로 처리한것을 이유가 있나요??!

filot
2023.09.14 10:56

PB 기준으로 mean 보다는 max다 더 높게 나오더라구요. 상식적으로 mean이 합리적겠지만...

skim1
2023.09.14 13:12

datamol 패키지 좋네요, 소개 감사합니다

stevekim
2023.09.16 14:38

감사합니다!! 저도 GNN 같은거 써보면 좌절만하네요... ㅠㅠ ㅋㅋ