基于Kert的中文主题关键短语提取算法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:kf3567
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Kert算法在中文主题关键短语提取结果精确率低、短语歧义性强和主题刻画能力弱等问题,提出一种基于Kert改进后的中文主题关键短语提取算法。该方法首先引入L统计量重构原分词算法,使得原分词算法具备一定的新词识别能力以减少分词后的词语歧义性,然后使用顺序合并代替Kert中的频繁模式增长(FP-Growth)解决候选关键短语集合中短语语序颠倒的问题,最后在此基础上加入改进后的约束排序算法后提出更加有效的中文主题关键短语提取算法。通过与多组近年比较经典的主题关键短语提取算法的对比实验表明:改进算法在提取的精确
其他文献
目的探讨心血管内科感染患者的临床治疗措施。方法选取2012年5月~2014年6月收治的心血管内科感染患者80例为研究对象,将其随机分为对照组和观察组,各40例。对照组采用传统治
目的分析优质护理措施对冠心病合并高血压患者的效果。方法选取2013年11月~2014年11月我院收治的冠心病合并高血压患者241例为研究对象,并随机分为试验组121例和对照组120例。
近年来,电梯安全事故屡见不鲜,为人们的安全意识再次敲响警钟。而在长期的维修和故障原因分析中,其中主要的安全故障表现为电气安全装置的接地出现故障。电梯的电气安全装置
目的:研究不同含锌饲料对幼鼠脑金属硫蛋白(Metalothionein,MT)表达的影响。方法:从哺乳期开始建立幼鼠低锌(ZincDeficiency,ZD)、常锌(ZincNormal,ZN)和高锌(ZincExcessive,ZE)动物模型,以流式细胞仪及免疫组化的方法,定位、定量观测脑组织(皮层、海马)内MT表
数控机床是制造业乃至整个国民经济的加工母机,对经济的发展起着至关重要的推动作用。虽然我国机床产业在经历了几十年的发展,很多方面都取得了令人瞩目的成就,但是仍面临着
2012年以来欧美各大银行纷纷陷入洗钱丑闻,本文主要分析了汇丰银行存在的一些问题,并结合我国目前商业银行反洗钱工作现状给出了一些政策建议
针对红层滑坡的特征,提出红层滑坡的治理应采取抗滑支挡、锚固、排水、护坡和生物防护等综合治理措施,并以实例加以说明,对红层地区进行工程建设具有现实意义。
目的:对高危药品的安全性进行问卷调查,全面梳理和挖掘工作中存在的风险因素。方法:采用便利抽样法选取镇江市18家二级以上医疗机构的医护人员260人作为研究对象,主要从医院
1 引言 1.1 计划目标 21世纪头10年的空中防御系统将需要使用新的探测和目标识别技术,以与变化的威胁环境相适应,特别是提供较好的抗干扰能力和较快的反应时间。 SAFRAN验证
随着我国经济发展,会计学专业本科教育已无法满足市场经济对管理型会计人才的需求。本文首先根据目前普遍的会计学专业课程设置进行现状分析,了解现在企业对管理型会计人才的