분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[추천 알고리즘 개발 방향 조언]
안녕하십니까. 2023 인하 인공지능 챌린지 담당 조교입니다.
시간이 꽤 지났음에도 많은 팀의 정확도가 낮은편이라 두 가지 부가 정보를 기존 평점 정보와 결합하여 추천 알고리즘의 성능을 향상시킬 수 있는 추천 알고리즘 개발 방향을 설명드리겠습니다.
1. 리뷰 정보 활용: 사용자-평점 행렬이 Sparse하다면 리뷰 정보를 활용하여 행렬을 보완하고 더 Dense하게 만들 수 있습니다. 리뷰가 있는 상품은 해당 상품에 대한 암묵적 선호도를 반영할 수 있으므로, 리뷰 정보를 상품에 대한 선호도 정보로 활용하여 추천 알고리즘의 성능을 향상시킬 수 있습니다.
2. 이미지 정보 활용: 이미지 정보는 상품 자체의 특징과 관련이 있으므로, 상품 임베딩 벡터를 향상시키는데 사용할 수 있습니다. 이를 통해 추천의 정확성을 개선시킬 수 있습니다.
3. Rating 활용: 리뷰 정보와 유사하게 Rating만으로도 사용자-평점 행렬이 Sparse한 것을 보완할 수 있습니다. Matrix Factorization이나 Collaborative Filtering 등을 사용한다면, 기존에 없었던 암묵적인 선호도를 찾아 행렬을 채우는 방식 등으로 추천 알고리즘의 성능을 높일 수 있습니다.
추가로 본 챌린지에서 사용하고 있는 NDCG (Normalized Discounted Cumulative Gain)메트릭에 대해 간단히 설명하겠습니다.
DCG는 추천 시스템에서 사용되는 랭킹 품질을 측정하는 지표로, 추천된 아이템들의 관련성(relevance)에 따라 각 아이템의 가치(gain)를 계산합니다. 높은 순위에 위치한 아이템일수록 높은 가치를 갖게 됩니다. NDCG는 DCG의 정규화된 버전으로, 추천 시스템의 성능을 비교하기 위해 사용됩니다. 모든 쿼리의 DCG 값을 해당 쿼리의 최대 가능한 DCG 값(IDCG)으로 정규화하여 계산하며, 모든 NDCG 값은 0부터 1 사이의 값으로 표현됩니다. NDCG가 1에 가까울수록 추천 시스템의 성능이 우수하다고 판단할 수 있습니다. 이를 통해 추천 시스템의 상대적인 성능을 쉽게 평가할 수 있습니다.
NDCG 상세 설명 - https://en.wikipedia.org/wiki/Discounted_cumulative_gain
추가적인 대회 관련 문의사항이나 질문이 있으신 분들은 해당 토크 게시판이나 flslzk@inha.edu 또는 hera2376@gmail.com 또는 mysid88@inha.ac.kr 로 문의주시면 안내드리도록 하겠습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
삭제된 댓글입니다