제2회 코스포 x 데이콘 도서 추천 알고리즘 AI경진대회 채용

채용 | 알고리즘 | 정형 | 추천시스템 | RMSE

  • moneyIcon 상금 : 채용
  • 1,309명 마감

 

[Private: 3.57759] 다른 방법 Linear Regression()

2023.06.09 13:42 1,936 조회 language

안녕하세요~

대략적인 분석 방향

⁠1. Train 데이터에서 User-ID(고객) & Book-ID(도서)별 평균 Book-Rating(평점)을 구한 컬럼 추가

⁠2. 2개 추가된 컬럼으로 LinearRegression() 회귀 모델을 사용하여 Book-Rating(평점) 예측
⁠⇒ 평균 RMSE 2.74가 나옴(대회 1등 RMSE가 3.02인것을 감안했을때 매우 우수하다고 판단)

⁠3. Train에서의 User-ID와 Book-ID별 평균 Book-Rating(평점) 컬럼을 Test 데이터에 User-ID와 Book-ID별로 Merge

⁠4. Merge된 User-ID와 Book-ID별 Book-Rating(평점) 평균으로 Test데이터의 Book-Rating(평점) 예측
⁠⇒ Train에는 없는 Test의 User-ID와 Book-ID는 나이, 사는 지역, 저자, 출판사, 출판년도별 평점 데이터를 통해 각각 예측하여 null값 대체
으로 분석해봤습니다.

https://wijun.tistory.com
에 다양한 분석과 자료 있어요 놀러오세요~ㅎㅎ

PDF
코드
이전 글
이전 글이 존재하지 않습니다.
현재 글
[Private: 3.57759] 다른 방법 Linear Regression()
대회 - 제2회 코스포 x 데이콘 도서 추천 알고리즘 AI경진대회 채용
좋아요 6
조회 1,936
댓글 0
2년 전
다음 글
[private: 3.27139] CatBoostRegressor + Optuna
대회 - 제2회 코스포 x 데이콘 도서 추천 알고리즘 AI경진대회 채용
좋아요 18
조회 2,921
댓글 5
2년 전