一种基于LDA的潜在语义区划分及Web文档聚类算法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:dapao123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义互作用机制对聚类结果进行修正。与相关工作比较,该文不仅应用LDA模型表示文档,而且进行了深入的语义分布区域划分,并将分析结果应用于Web文档聚类。实验表明,该文提出的基于LDA的文档类别与语义互作用聚类算法获得了更好的聚类结果。
其他文献
为了探讨中华绒螯蟹(Eriocheir sinensis)颤抖病的发生原因,从表现出颤抖症状的中华绒螯蟹中初步分离纯化出一种病毒,人工感染健康触,出现明显的阳性反应,并从人工感染的蟹的血液、肠道、性腺等组织
在中国饮食史上,两宋是一个历史性的转折期,中国人的食物开始从匮乏向丰盛过渡。良种水稻的引进、农田的开发、精心的育种,以及深耕细作技术的推广,让人们从大自然获得了更丰厚的馈赠。在北回归线温暖的阳光下,农作物创造出更丰富的食材,并通过发达的市场网络输送到各地。平民的饮食习惯在这个时期从二餐制演变成三餐制。  摆脱了饥饿威胁的人们有了更闲适的时间、更从容的心思来琢磨饮食,研究烹饪之道,发明各种美食,以满
1613年2月27日,经全俄缙绅会议选举产生的俄罗斯沙皇米哈伊尔·费多罗维奇·罗曼诺夫在克里姆林宫圣母升天大教堂正式加冕。从此,开始了俄国历史上的罗曼诺夫王朝统治。1689年,米哈伊尔沙皇的孙子年仅17岁的彼得,依靠禁卫军的帮助发动政变,软禁了与他发生权力之争的姐姐和兄长,宣布亲政,称为彼得一世(1689年~1725年)。  当时的俄罗斯领土面积已达1400万平方公里,虽拥有巨人的身躯,却少了往日
<正>~~
计算机、多媒体技术的迅速发展使多媒体教学在中职数学课堂教学中发挥着重要作用.针对中职数学课堂教学的现状及学生的特点,指出目前多媒体课件在数学课堂教学中应用所存在的问
大麦黄矮病毒(BarleyYelowDwarfVirus,BYDV)是黄矮病毒组(Luteovirus)中的一员。它只能通过蚜虫传播,广泛流行于北美、欧洲、东亚的大麦产区。大麦黄矮病主要引起大麦矮化,抑制分蘖,减少穗数,造成不孕以至不能结实。除大麦
以抚顺市雷锋纪念馆为原型,用三维建模与虚拟现实技术VRML语言建立三维浏览模型.展开雷锋纪念馆建模的分类工作,研究虚拟纪念馆建筑和展厅的建模方法.
<正>~~
为了5&#183;15,陈羽凡、胡海泉这几天一直在做各种采访,状态近乎“发疯”,已经好几年没这样了。他们反复念叨“5&#183;15红五月羽泉北京演唱会”。这次演唱会的演奏班底非常