분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
SMILES 분자 구조 기반 유사도 분석 및 시각화
1. SMILES → RDKit Mol 객체 변환
분자 구조를 파싱하고 유효하지 않은 항목 제거
2. 물리·화학적 피처 추출
분자량, 고리 수, 원자별 개수, 기능성 그룹 개수 등
3. Fingerprint (Morgan) 계산
각 분자의 구조를 이진 벡터로 표현하여 유사도 계산에 활용
4. 공통 구조(MCS) 분석
임의 분자쌍의 최대 공통 부분 구조를 시각화
5. 유사도 행렬 및 클러스터링
MCS 기반 / Fingerprint 기반 Tanimoto 유사도 행렬 생성
계층적 군집 분석과 Clustermap 시각화
6. PCA 기반 시각화
고차원 유사도 행렬을 2D 공간에 시각화하여 구조적 패턴 탐색
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
외부데이터 증강한 것에 분석한거라서 원본 학습데이터의 분석결과는 아닙니다..!