基于多特征融合的中文关键词提取方法

来源 :第二十六届全国计算机信息管理学术交流会 | 被引量 : 0次 | 上传用户:winbourbit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  关键词提取技术是文本分类、文本聚类、信息检索等技术的基础,在自然语言处理领域有着非常广泛的应用。本文结合传统关键词提取方法的特点,提出一种基于多特征融合的中文关键词提取方法。该方法通过结合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法在不同测试集上与传统方法相比关键词提取的平均召回率均得到明显提升。
其他文献
经国家卫生部批准中国民族卫生协会严格评选,郭老师荣获“中国中医药事业发展杰出贡献奖”1月10日在人民大会堂受到全国政协副主席阿不来提、全国人大副委员长何鲁丽、顾秀莲
  命名实体识别作为自然语言处理的重要组成部分,是信息抽取、信息检索、自动文摘等其他处理技术的重要基础。因此,命名实体识别的研究具有广阔的应用前景和巨大的现实意义。
上海华氏·杨浦大药房华氏杨浦大药房是上海华氏下属独立核算的全资子公司,营业面积2000平米,底楼 Shanghai Fahrenheit Yangpu Pharmacy Fahrenheit Yangpu Pharmacy is a
A new Multiple Access Control (MAC) protocol-User Adaptive Scheduling Multiple Access (UASMA) protocol is proposed in this paper. It can well schedule the packe
溪蜜柚为福建推广的良种。厦门市集美区从1988年开始引种,现有栽培面积126hm2,该品种对肥水管理要求较高,根外追肥已成为柚农提高产量、改善品质的主要措施之一。本试验选择近期国内外已
目的:分析广东省50家医院血液内科血标本来源细菌的构成和耐药性,了解血液内科血流感染(BSI)的流行病学特征。方法:基于国家细菌耐药监测网(CARSS)平台,对2019年广东省50家医院血液
  火力發電及汽電共生廠所使用之鍋爐均為極高溫、高壓之型態,汽水循環中從鍋爐給水至高壓蒸汽產生的過程中,給水與蒸汽的品質關係著電廠營運效率與可靠性,同時對電廠之鍋
会议
  本文基于N-Gram 理论实现了一个多语言自动识别系统,对中文简体、中文繁体、英语、法语、德语、俄语和韩语等在互联网中广泛使用语言的文本进行了语言自动识别研究。实验
会议
构筑市场平衡震荡格局的基础依旧没有发生根本性的转变,无论是从估值还是从近期的刺激因素来看,我们认为目前是对大盘蓝筹基金进行战略性配置的时机。 The fundamentals of
  基于清华大学汉语树库,根据汉语词汇的句法功能分布,本文构建了句法功能分布知识库。在构建的句法功能分布知识库基础上,本文基于SFC(Sparse Feature Clustering)中的K-medo