pLSA模型--基于概率统计的pLSA模型(probabilistic Latent Semantic Analysis,概率隐语义分析),增加了主题模型,形成简单的贝叶斯网络,可以使用EM算法学习模型参数.概率潜在语义分析应用于信息检索,过滤,自然语言处理,文本的机器学习或者其他相关领域. D代表文档,Z代表主题(隐含类别),W代表单词: P(di)表示文档di的出现概率, P(zk|di)表示文档di中主题zk的出现概率, P(wj|zk)表示给定主题zk出现单词wj的概率.每个主题在