基于主题模型的检索结果聚类应用研究

来源 :情报杂志 | 被引量 : 0次 | 上传用户:ccx1942
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语义的检索结果聚类研究,具有重要的理论和实践意义。[方法/过程]将LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,将“文本-潜在主题”概率分布作为Kmeans聚类依据进行聚类分析,最后提取与聚类中心最近的主题的描述词作为检索结果聚类的标签。[结果/结论]实验
其他文献
采用厌氧反应器与膜生物反应器(MBR)组合工艺处理毛纺印染废水,结果表明,当进水COD、BOD5和色度分别为128~321 mg/L、36~95 mg/L和40~70倍时,出水COD、BOD5、色度、浊度的平均值
[目的/意义]期刊等级是权威机构对期刊质量的认可,是学者们选择发表和阅读前沿学术成果的参考标准。因此,期刊等级的变化态势研究对机构研究和提高期刊等级具有十分重要的作
骨骼发育在儿童、青少年时期最为关键,成人骨量的50%是在青春快速增长期获得的。虽然遗传对骨质起着决定性的作用,但是体力活动和饮食行为因其可调节性,对青春期骨骼发育具有潜在