line-coupon

DASCHOOL Discount Returns!

line-coupon-mobile

DASCHOOL Discount Returns!

The 1st Drug Development AI Competition

Algorithm | SMILES | Tabular | Regression | Biology | RMSE

Prize : 2,900만원
2023.08.07 ~ 2023.09.25 10:00 + Google Calendar
1,697 Users Completed

Overview Data Code (share) Talk Leaderboard

Submission

Random Forest, LB = 30.72567

배가_고파졌다

2023.08.12 12:24 6,307 Views language

language

Random Forest를 활용한 훈련 코드입니다.
코드는 아래 순서로 진행됩니다.

1. 데이터 전처리: "AlogP"의 결측치를 "LogD"로 대체합니다.
2. 데이터 분할: KFold를 활용하여 총 10개 Dataset으로 분리합니다.
3. Ensemble: 각 Dataset에서 얻은 모델로 예측한 후 평균하여 최종 결과를 냅니다.

Code

Login Required

comment

0 / 1000

비회원

2023.08.13 22:12

SMILES는 사용안하신건가요?

배가_고파졌다

2023.08.14 19:25

네

ruv

2023.09.03 11:42

Fold 안에 모델을 계속 재정의하셨는데 이유가 있을까요?

배가_고파졌다

2023.09.03 22:56

Fold 별로 학습 데이터에 따라 각각 학습시키려고 모델을 새로 만들었습니다.

배가_고파졌다

2023.09.03 22:59

랜덤 포레스트는 해당이 안될수도 있는데요,
fit()을 실행하는 경우 이미 학습된 모델에서 시작하는 경우도 있어서 새로 만들어 주었습니다.

최성진

2023.09.08 11:26

감사합니다. 참고 많이 했습니다

📣 The comment input field has been moved to the top of the comment list!

to_list

DeepChem을 이용한 MPNN 학습

Competition - 제1회 신약개발 AI 경진대회

Current

Random Forest, LB = 30.72567

Competition - 제1회 신약개발 AI 경진대회

Likes 41

Views 6,307

Comments 6

2yr ago

[Baseline] Morgan Fingerprint + MLP

Competition - 제1회 신약개발 AI 경진대회