关于python:协同过滤的矩阵分解——新用户和项目?

Matrix factorization for collaborative filtering - new users and items?

我一直在阅读有关使用矩阵分解进行协同过滤的文章,但我似乎找不到处理向系统添加新用户或项目,或让用户评价新项目的示例。在这些情况下,需要重新计算项目-用户矩阵和分解,对吗?这如何在大量用户和物品的情况下表现良好?有办法解决吗?

谢谢


您的问题分为两部分:(A)如何处理新用户和新项目,以及(B)如何处理新交互(例如评分、点击等)。

(A) 处理新用户和新项目基本上有两种不同的策略(无论我们使用矩阵分解还是其他方式):

  • 从用户(人口统计、调查)或项目(价格、流派、文本描述、类别)属性估计用户/项目特征
  • 主动学习:向与系统交互的所有用户展示新项目,或向系统的新用户展示某些项目,以平衡个人用户体验和系统获得的信息。
  • 学术文献中有很多关于这两个问题的论文。

    (B) 这确实没有问题——矩阵分解模型的增量更新不会产生高计算成本。参见例如这篇论文:http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.165.8010