분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 7위/ 0.33491] Hybrid GNN-based Content-Aware Recomme
초기 설정 및 데이터 로드:
필요한 라이브러리를 import 합니다.
seed_everything 함수로 랜덤 시드를 설정하여 재현성을 확보합니다.
NLTK 데이터를 다운로드하고 CSV 파일들을 로드합니다.
데이터 전처리:
결측치를 'Unknown'으로 채웁니다.
각 언어별 불용어를 정의합니다.
preprocess_text 함수로 텍스트를 전처리합니다 (URL 제거, 특수문자 제거, 소문자 변환, 토큰화, 불용어 제거).
특성 추출:
TF-IDF 벡터화를 수행하고, TruncatedSVD로 차원을 축소합니다.
콘텐츠 기반 유사도 행렬을 계산합니다.
그래프 데이터 준비:
사용자-기사 상호작용 행렬을 생성합니다.
그래프의 엣지 인덱스를 준비합니다.
노드 특성(사용자 및 기사)을 준비합니다.
GNN 모델 정의:
HybridGNN 클래스를 정의합니다. 이는 GraphSAGE 레이어와 선형 투영 레이어를 포함합니다.
모델 학습:
모델과 옵티마이저를 초기화합니다.
1000 에폭 동안 모델을 학습시킵니다.
각 에폭에서 손실을 계산하고 역전파를 수행합니다.
추천 생성:
학습된 모델을 사용하여 GNN 유사도를 계산합니다.
GNN 유사도, 사용자-기사 행렬, 콘텐츠 유사도를 결합하여 최종 점수를 계산합니다.
각 사용자에 대해 상위 5개의 기사를 추천합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
그래프 뉴럴넷 적용하셨는데 loss function mse 사용하셨네요..!! 심박합니다. Hoxy 해당 작업 진행하실때 레퍼런스 사이트나 참고할만 내용 공유 가능하실까용?