多特征融合文本聚类的新闻话题发现模型

来源 :国防科技大学学报 | 被引量 : 0次 | 上传用户:ndspsp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型。模型根据新闻的多特征影响,提出一种多特征融合文本聚类方法。该方法针对新闻标题、新闻重要段落等特征因素构建向量空间模型及相似度算法,基于潜在狄利克雷分配模型构建主题空间模型及相似度算法,针对命名实体构建命名实体模型及相似度算法,并将三种相似度算法形成最优融合。基于多特征融合文本聚类方法,模型改进了用于新闻话题发现的Single-Pass算法。实验是在真实新闻数据集上开展的,实验结果表明:该模型有效地
其他文献
就方位多相位中心(Azimuth Multiple-Phase-Center,AMPC)合成孔径雷达(Synthetic Aperture Radar,SAR)系统的阵列误差对信号重建性能的影响进行分析。将阵列误差建模为随机过
管理者常常抱怨对员工的激励没有达到预期效果.其原因不是员工不愿受到激励,而是激励本身没有带来他们所期望的结果.笔者根据激励理论提出了个性化激励的概念,强调激励是针对
本文首先介绍了卤汁的配制,然后阐述了卤味猪耳的制作方法,最后对现代卤味猪耳加工技术进行展望,希望通过本文的分析,能为卤味的继承与发展提供一些参考。
[目的/意义]查证“信息疫情”(Infodemic)概念缘起,探析社交媒体时代信息疫情的成因与特点。在此基础上初步建构防控体系,提出防控对策,丰富当前复杂信息环境下信息疫情研究
2004年,我国学者根据临床用药的实际情况,将抗癌药物分为细胞毒类药物、激素类药物、生物靶向治疗药、单克隆抗体、细胞分化诱导剂、细胞凋亡诱导剂、新生血管生成抑制剂、表皮
2010年,海地、琉球群岛、智利、台湾高雄、青海玉树发生强烈地震,震级高,影响范围大,造成的人员伤亡和财产损失也很大。从板块运动角度分析。板块边界往往是地震活动集中区域,称之
我国的茶叶生产历史悠久,但对茶叶功能食品的开发却缺乏一定的力度。本文阐述了茶叶功能食品开发的意义、茶叶功能食品的优点以及茶叶功能食品发展中存在的问题,并提出了发展
为了在分布式存储的大规模数据图上进行快速图模式匹配,提出利用局部评估的分布式图模式匹配算法。各计算节点并行地执行本地匹配;协调器节点收集局部匹配结果、计算边界点的
水土流失是土壤侵蚀的一种主要形式,是指在水力、重力、风力等外营力作用下,水土资源和土地生产力的破坏和损失,包括土地表层侵蚀和水土损失,亦称水土损失。
目的观察中药汤剂配合痤疮粉(本院制剂)、粉刺酊(本院制剂)、红蓝光、刺血拔罐治疗痤疮临床疗效。方法 90例患者随机分为2组,治疗组:口服中药汤剂150 ml,日2次,外用痤疮粉日1