基于词汇同现模型的关键词自动提取方法研究

来源 :沈阳理工大学学报 | 被引量 : 0次 | 上传用户:guansuwei9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词提取是中文信息处理的一个关键环节。提出一种关键词自动提取的有效方法,首先对普通词典进行了扩充,在普通词典的基础上结合大量的训练样本对词典进行训练得到一个带有TFxIDF值和互信息的优化词典。然后在此词典上按段落进行切词,对切词结果集根据词频、权重、同现关系和互信息排序后筛选出候选关键词。最后根据候选词的上位词和下位词进行词汇合并,设定一个阀值,取出其中的n个词作为文章的关键词。通过小数据测试样本集的抽取实验结果表明,文中方法在一定程度上能够提高关键词提取的正确率,得到了较为满意的效果.
其他文献
越来越多的工业活动需要在水下进行,为了探测水下结构及工作环境,必须排除曾经的常规旁扫探测方式对水下工作环境进行探测,需要用到其他更高端技术来对水下存在的安全隐患进
近年来,随着我国经济的快速发展,人们对物质生活水平要求越来越高,对相应基础设施的要求也越来越高.水利工程施工过程中,河道的整治是非常重要的环节,科学合理的排涝引水河道
随着经济社会的发展,水资源越来越紧缺.通过探讨利用现有水库死库容,解决城市近期生活生产用水需求.
为了进一步促进我国企业人力资源运行效率以及质量的提升,企业在运行发展的过程中需要积极促进青年员工的素质以及综合能力的提升,需要积极加强对于办公室跨岗交流作业的开展
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的研究和探讨中医护理干预在过敏性紫癜患儿中的临床效果分析。方法选取我院17年5月~18年6月期间在我院就诊住院治疗的过敏性紫癜患儿,随机抽取97例,做为本次研究对象,按照
2004年出台的规定使我国的IPO定价方式由控制市盈率法转变为询价制度法,向机构投资者询价会使得IPO定价更受被询问者的看法所左右。基于信号理论,投资者认为高声誉的会计师事务
为了更准确地识别人脸的表情信息,采用加权主元分析识别人脸表情.首先通过小波变换进行图像分解来抽取面部区域的有效鉴别特征,然后将特征加权和主元分析相结合,根据加权重建误差最小化,计算出各类训练样本的加权子空间,最后计算测试样本到加权子空间的Mahalanobis距离,并根据距离进行分类识别.通过CMU人脸表情数据库试验证明,该方法与传统的主元分析相比可以在不增加运算量的情况下大大提高识别率.
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
本次的翻译任务是中国核心语汇项目,它是由中国出版集团公司发起,由中国对外翻译有限公司、中译语通科技(北京)有限公司组织实施的互联网大数据语料库。该项目是由校外导师推