基于内容的推荐的基本推荐思路是:用户喜欢幻想小说,这本书是幻想小说,则用户有可能喜欢这本小说

  两方面要求:(1)知道用户的喜好;(2)知道物品的属性

  基于内容的推荐相比协同过滤方法(个人观点):协同过滤用到了大量用户的群体行为特征,两个特点,(1)要大量用户,(2)除了用户的行为之外,不需要其他信息;基于内容的推荐,需要用户和物品的额外信息,如:用户喜好、物品属性等等,但是不需要存储、处理大量的用户数据。

  基于内容的推荐和基于知识的推荐没有明确界限,两者区别:前者更侧重于提取物品属性,后者更侧重于因果关系。

  基于内容的推荐一般应用在在文章、新闻推荐上面。文章的属性从文本内容中自动抽取。用户的喜好从用户从前评价过的文章中抽取。一般以关键词来表示文章和用户。

  1. 内容表示和相似度

  基于内容推荐的基本思路是:计算物品与用户喜欢的物品的相似度,从而确定用户是否喜欢该物品
  如何获取用户的喜好?(1)明确的问用户;(2)请用户为一系列item进行打分,从而自动抽取特征
  经典方法:用关键词来表示文本、tfidf表示关键词的权重、VSM模型来计算文本之间的相关度
  问题:如何选取最有代表性的N个词语(特征选择)。
  缺点:没法利用词语上下文信息

  2. 基于内容相似度检索

  协同过滤方法可以描述成为“推荐相似用户喜欢的物品”;基于内容的推荐方法可描述成为“推荐与用户过去喜欢的物品相似的物品”。这一节在上一节的基础上,讨论具体如何给用户推荐物品。

  2.1 k近邻方法
  对于某个用户未见的物品,找到用户从前评价过的k个与当前物品最相似的物品,根据用户对这k个物品的评分,来投票解决当前未知物品的评分。
  Billsus2000,个性化移动新闻推荐:KNN用于对用户短期兴趣进行建模,用概率分类模型来对用户长期兴趣进行建模。长短两个模型共同作用,来给用户进行个性化新闻推荐。
  如何组合长短兴趣模型?方法1:优先短期模型,然后长期模型;方法2,用短期模型把所有相关的item找到,然后用长期模型进行综合排序

  2.2 相关性反馈 —— Rocchio方法
  需要用户在使用过程中明确对item给出反馈,不实用。
  在实际使用中可以考虑获取用户隐式反馈。
  个性化搜索?如何把不同的相关度体系(pagerank和用户和物品相关度)融合在一起是个问题。

  3 其他文本分类方法

  将推荐问题转成分类问题,用分类器来做推荐,例如:朴素贝叶斯+二分类,来预测用户是否喜欢某个特定商品
  还有svm、决策树等模型。涉及到特征选择,用卡方选择或者fisher判别。

  4. 小结

  基于内容的推荐技术,大多数方法都源于信息检索领域。

  参考文献http://blog.csdn.net/xceman1997/article/details/41791651

最新文章

  1. Webpack从入门到上线
  2. python学习之路-day1-python基础1
  3. [saiku] 配置saiku实时展现查询数据
  4. Java学习笔记(2):jdk的配置
  5. 慎用MonthsBetweent和MonthSpan
  6. DOM操作-遍历一个元素的所有属性
  7. Github上的600多个iOS开源类库
  8. read命令读取用户输入
  9. Windows-universal-samples-master示例 XamlCommanding
  10. zabbix解决监控图中出现中文乱码问题
  11. HTML基础教程
  12. 洛谷 P1856 【Picture】
  13. springcloud 笔记
  14. 新建oracle数据库表空间及删除表空间和用户
  15. Ubuntu服务器的anaconda环境修复办法(自动进入base环境怎么办?)
  16. WP8.1学习系列(第八章)——透视Pivot设计指南
  17. /proc/meminfo
  18. JavaScript初学者建议:不要去管浏览器兼容
  19. Python3.5 学习二
  20. Java学习---常见的模式

热门文章

  1. Android报错:The content of the adapter has changed...与Channel is unrecoverably broken and will be disposed的分析与解决办法
  2. IIS日志
  3. android64位机子兼容32位.so库文件
  4. JAVA实现上传下载共享文件
  5. (转)Spark安装与学习
  6. 查看cpu、内存和硬盘
  7. ThinkPHP3.2 加载过程(二)
  8. 多文件上传 iOS功能
  9. DWZ 刷新 dialog
  10. PHP版3DES加解密类