基于高维聚类技术的中文关键词提取算法

来源 :中国管理信息化 | 被引量 : 0次 | 上传用户:xjl982050
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词提取是中文信息处理技术研究中的热点和难点,基于统计信息的方法是其中一个重要分支。本文针对基于统计信息关键词提取方法准确率低的问题,提出基于高维聚类技术的中文关键词提取算法。算法通过依据小词典的快速分词、二次分词、高维聚类和关键词甄选4个步骤实现关键词的提取。理论分析和实验显示,基于高维聚类技术的中文关键词提取方法具备更好的稳定性、更高的效率和更准确的结果。
其他文献
毕业论文写作是高职高专学校实现其培养目标的重要教学环节,在提高和检查毕业学生综合运用理论知识,分析和解决问题以及科学研究的能力等方面,有着不可替代的作用。因此,做好
文章通过文献回顾,构建了知识特性、知识来源方与接收方特性、组织情境、知识转移机制与跨国企业知识转移绩效之间关系的理论模型,并以江苏、浙江、广东三省的跨国企业为调查
尿羟脯氨酸测定条件的探索江苏省盱眙县卫生防疫站顾永德矽肺患者由于胶原的合成和分解过程的增强,从而导致尿羟脯氨酸含量的增加,在当患者体内胶原转化增加的情况下,出现尿羟脯
讨论基于CORBA的综合网络管理系统的设计思想、体系结构 ,并介绍CORBA与CMIP/SNMP相互转换网关模型及其规范研究。
电子竞技是一项目前发展很快的竞技体育运动.对电子竞技的概念和特征作了分析,并对目前国内外电子竞技的发展现状作了探讨,在分析电子竞技发展的影响因素后提出了发展策略.
我国体育实行社会化发展道路的20多年来,取得了显著的成绩,但是,并未实现体育“文化本位”的回归。因此,提出体育继续社会化的概念,确立“文化层面社会化”的未来体育社会化发展目
结合5C技术,介绍一种基于监视控制和数据采集(SCADA)的统计过程控制(SPC)系统设计架构,包括:现场多工序多点测量采集系统设计;通过对异常判定诊断模型分析,介绍软件如何实现测量数据实时跟踪回溯及实时选控图异常判定告警等。
在分析了组件动态组装技术和基于角色访问控制(RBAC)的基础上,提出了一种基于角色的组件动态组装模型,给出了该模型中访问控制表的设计、组件的动态组装模型和客户程序与组件间的交互过程。通过实例说明了文中给出模型的实现技术。
4月17日,英国诺桑比亚大学代理副校长大卫·柴斯(DavidChesser)、体育部主任伊恩?艾尔文、心理学与运动科学学院副院长凯文·罗伯逊博士和心理学与运动科学学院对外发展
以19位运动员为试验对象,通过Kistler三维测力系统,研究在不同负荷状态下“牵拉-缩短周期”(SSC)练习中下肢肌肉活动的力学特性。结果证明,随着负荷强度(跳深高度)的增加,反弹力量和