基于PLSA方法的用户兴趣聚类

来源 :东北大学学报(自然科学版) | 被引量 : 0次 | 上传用户:bingqing1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了在个性化搜索过程中能够准确地挖掘到用户的潜在兴趣并进行相应的聚类分析,提出采用潜语义空间的Zipf分布的特性,并结合PLSA(概率潜在语义分析)来获取全文的语义.即先通过Zipf分布原理找到文档的潜在语义空间,在此空间中对用户的兴趣进行聚类,并建立用户兴趣描述文件(user profile),即建立用户兴趣层次树.实验表明,所提出聚类算法的聚类效果明显优于传统的VSM(向量空间模型)的聚类效果,同时,在著名的CTI数据集上的个性化推荐实验结果也充分说明基于潜在语义空间构建的用户兴趣描述与用户真实兴趣相符合.
其他文献
针对云制造环境下制造资源调度的特点和存在的问题,建立了云制造环境下制造服务资源多目标调度模型。根据云制造环境下极易发生扰动的特点,提出了一种动态调度技术,以在发生
<正>产蛋率是衡量种禽生产性能的主要指标。由于机体生理功能的转变,加上营养、疾病等的综合影响,进入产蛋后期的种鸭,产蛋率明显降低,而且蛋的破损率提高。影响种鸭生产性能
开展高校党建工作评价机制研究工作,意义重大。文章立足高校党建工作评价机制,从高校党建评价导向确立入手,展开分析,确立党建工作评价指标和评价模块组成的划分依据和类别,
被害人宽恕,对构建恢复性司法具有重大的影响。宽恕能够消除愤恨,让生活得以继续。宽恕能够使被害人理性地对待犯罪人,与犯罪人重建一种新型的、建设性的关系。宽恕是刑事和
采用Maxwell 2D有限元软件建立了传统阵列与Halbach阵列的1.5 MW外转子永磁风力发电机的2D模型。在转子轭为导磁和非导磁材料的情况下,分别对三种不同充磁方式、三种不同永磁
绿色与可持续性建筑的本质在于平衡和协调室内、室外环境及满足用户的不同需求,达成建筑与环境的融合。近年来,随着城市建筑密度急剧加大,传统的建筑采光设计方法已不能满足
为保证图书馆灰色文献资源开发和利用的合法性、有效性、稳定性和可持续性,必须制定一些具有普遍性的基本原则,即无论什么类型或规模的知识服务机构,开发和利用何种类型的灰
目的研究首发吸烟精神分裂症患者的血清神经元特异性烯醇化酶(NSE)水平、认知功能及临床特征,探索吸烟与精神分裂症的关系。方法调查70例首发的男性精神分裂症患者的吸烟状况
一、杂色蛤试养特征与适应性江苏南部沿海适宜于除文蛤以外其他贝类的养殖生产,但缺少杂色蛤天然种群,针对这一特殊的区域位置,白2000年开始,各地对杂色蛤移苗增养殖进行了广泛的