Boost up AI 2025 : 신약 개발 경진대회

Algorithm | SMILES | Tabular | Regression | Biology | NRMSE | PCC

  • moneyIcon Prize : 13,000,000 KRW
  • 1,282 Users Completed

 

SMILES 분자 구조 기반 유사도 분석 및 시각화

2025.07.02 11:47 1,904 Views language

1. SMILES → RDKit Mol 객체 변환
분자 구조를 파싱하고 유효하지 않은 항목 제거

2. 물리·화학적 피처 추출
분자량, 고리 수, 원자별 개수, 기능성 그룹 개수 등

3. Fingerprint (Morgan) 계산
각 분자의 구조를 이진 벡터로 표현하여 유사도 계산에 활용

4. 공통 구조(MCS) 분석
임의 분자쌍의 최대 공통 부분 구조를 시각화

5. 유사도 행렬 및 클러스터링
MCS 기반 / Fingerprint 기반 Tanimoto 유사도 행렬 생성
계층적 군집 분석과 Clustermap 시각화

6. PCA 기반 시각화
고차원 유사도 행렬을 2D 공간에 시각화하여 구조적 패턴 탐색

Code
Login Required
0 / 1000
당태
2025.07.02 14:32

외부데이터 증강한 것에 분석한거라서 원본 학습데이터의 분석결과는 아닙니다..!