Ucas Web Mining hw——News recommendation
用户id 新闻id 阅览时间 新闻标题 新闻内容 新闻时间
- 设评分矩阵为R,大小为m×n,代表m个用户,n条新闻。R中元素r_ij代表着用户u_i对新闻i_j的评分。
- 对R进行奇异值分解,得到R=U·S·V^T
- 选择映射到低维空间的维度,重构评分矩阵,得到用户对每条新闻的打分值
根据tf-idf方法,基于新闻标题和内容的关键词,计算每一条train新闻对应的test新闻的相似度
- 对每个老用户,推荐其在训练集中未看过的、在重建评分矩阵中评分较高的新闻,以及测试集中与训练集中高评分新闻相似度较高的新闻;
- 对于新用户(即冷启动用户)则推荐训练集中的热点新闻,以及测试集中与热点新闻相似度高的新闻。