多特征关键词提取算法研究

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:BlueHeart1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词提取技术是语料库构建、文本分析处理、信息检索的基础.采用传统的TFIDF算法提取关键词时,主要依据词频计算权重,而未考虑文本特征项的影响,由于对词频的过度依赖,导致其提取关键词的准确性不高.针对这个问题,本文根据关键词的特性,引入位置和词性作为影响因子,对TFIDF算法权重重新进行了计算和排序,从而改进该算法,并利用Python语言完成了实现.实验结果表明,采用该改进方法提取关键词,其召回率、准确率、F因子与传统方法相比均得到明显提升.
其他文献
探讨了西部地区继续教育计算机应用基础课程教学内容的改革与建设,即课程建设的目标,教学方法的改革,教学手段的改革。实践表明,这些改革可有利提高学生应用计算机的能力和创
对10个单向受力石楼板的受弯性能进行试验,重点研究石板的受弯破坏形态、沿截面高度的应变分布规律和受弯承载力.试验结果表明:石板受弯破坏形态为完全脆性破坏,其受弯承载力
<正>目的探讨五级检伤分类法对急诊创伤患者进行预检分诊的价值。方法于2009年10月至2010年10月,采用五级检伤分类,即加拿大检伤急性分类法(CTAS)应用于浙江新安国际医院急诊
会议
现代电子系统几乎都面临着高速、大容量数据流的运算与处理问题。在许多应用场合,如雷达、通信、声纳、图像、智能仪器等,都需要设计、应用高速数据采集系统,以在极短的时间
学习型社会,是人类认识自然和社会、不断完善和发展自我的必由之路。无论一个人、一个团体,还是一个民族、一个社会,只有不断学习,才能获得新知识,增长才干,跟上时代。中国在
本文论述了西昌学院图书馆管理系统的设计、开发及实现过程。首先,概括介绍了软件工程理论的相关概念、技术基础以及系统的开发背景,然后综合运用软件开发策略和多种系统开发
气体干燥剂的选用□天水铁一中王亚伟实验室制取气体经常要选择合适的干燥剂对气体进行干燥。由于干燥剂的性质、类别不同,被干燥气体性质各异,学生在选择干燥剂时往往出现差错
本文设计了中小企业财务风险综合评价指标体系,包括定性指标和定量指标,并且在定量指标中引入现金流量指标,构建了基于AHP-模糊综合评价方法的中小企业财务风险综合评价模型,
基于729份问卷数据和工作价值取向视角,运用probit模型实证分析了谋生价值、职业价值和呼唤价值三个维度的认可度对农民工离职意愿的影响。研究结果表明:谋生价值和职业价值
文章在对国内外有效课堂研究梳理的基础上,结合文献研究的内容,总结出高职院校"商务数据分析"实践教学有效课堂建设中"教什么、用什么教、怎么教、怎么评"的关键点,最后分别