웹 기사 추천 AI 경진대회

알고리즘 | 정형 | 언어 | 추천시스템 | 웹 로그 | Recall

  • moneyIcon 상금 : 인증서 + 데이스쿨
  • 352명 마감

 

[Private 7위/ 0.33491] Hybrid GNN-based Content-Aware Recomme

2024.07.02 15:53 49 조회 language

초기 설정 및 데이터 로드:

필요한 라이브러리를 import 합니다.
seed_everything 함수로 랜덤 시드를 설정하여 재현성을 확보합니다.
NLTK 데이터를 다운로드하고 CSV 파일들을 로드합니다.


데이터 전처리:

결측치를 'Unknown'으로 채웁니다.
각 언어별 불용어를 정의합니다.
preprocess_text 함수로 텍스트를 전처리합니다 (URL 제거, 특수문자 제거, 소문자 변환, 토큰화, 불용어 제거).


특성 추출:

TF-IDF 벡터화를 수행하고, TruncatedSVD로 차원을 축소합니다.
콘텐츠 기반 유사도 행렬을 계산합니다.


그래프 데이터 준비:

사용자-기사 상호작용 행렬을 생성합니다.
그래프의 엣지 인덱스를 준비합니다.
노드 특성(사용자 및 기사)을 준비합니다.


GNN 모델 정의:

HybridGNN 클래스를 정의합니다. 이는 GraphSAGE 레이어와 선형 투영 레이어를 포함합니다.


모델 학습:

모델과 옵티마이저를 초기화합니다.
1000 에폭 동안 모델을 학습시킵니다.
각 에폭에서 손실을 계산하고 역전파를 수행합니다.


추천 생성:

학습된 모델을 사용하여 GNN 유사도를 계산합니다.
GNN 유사도, 사용자-기사 행렬, 콘텐츠 유사도를 결합하여 최종 점수를 계산합니다.
각 사용자에 대해 상위 5개의 기사를 추천합니다.

PDF
코드
로그인이 필요합니다
0 / 1000
byc3230
2024.07.03 00:34

그래프 뉴럴넷 적용하셨는데 loss function mse 사용하셨네요..!! 심박합니다. Hoxy 해당 작업 진행하실때 레퍼런스 사이트나 참고할만 내용 공유 가능하실까용?