【摘 要】
:
关键词自动抽取是利用计算机从文献中提取出反映主题信息的词语,是信息检索、文本分类、文本聚类以及自动文摘生成等技术的基础。在基于统计的关键词抽取方法中,由于其特征
【机 构】
:
太原理工大学 计算机科学与技术学院,太原 030024
【出 处】
:
第10届全国计算机支持的协同工作学术会议暨中国计算机学会协同计算专委年度工作会议
论文部分内容阅读
关键词自动抽取是利用计算机从文献中提取出反映主题信息的词语,是信息检索、文本分类、文本聚类以及自动文摘生成等技术的基础。在基于统计的关键词抽取方法中,由于其特征单一,统计方面不全,很容易受到一些高频非关键词的干扰。而本文从多方面进行统计,考虑影响关键词识别的各个因素,通过词频、间距、词性、重要度多个特征的提取与结合,提出了一种新的关键词抽取方法。该方法通过对文本数据进行预处理、特征统计、权重计算,改善了过去基于统计方法的不足之处,同时加入的间距特征,也更加适用于一般的写作结构。最终和传统TF-IDF方法的对比实验结果中,该方法各方面性能都有所提高,表明本方法是有效可行的。
其他文献
大数据时代的到来对人们的生活、工作甚至是观念都产生了极大的影响,也给各行各业的发展带来新的机遇和挑战.财务管理是企业管理工作的关键与核心,有效的财务管理工作有利于
路由是无线传感器网络中的关键问题之一,实际应用中由于障碍物的存在而影响网络的连通性和链路的通信质量.针对存在障碍物的通信环境,本文提出一种障碍物感知的路由选择
随着现代化社会经济的快速发展,科学技术的不断推进下,使得各个企业的内部结构都发生了重大变革,这个时候更加需要完善企业财会内部控制,促使企业财会资料更加完整,企业在财
3月15日,中国科协召开党史学习教育动员大会暨科协系统党校2021年开学典礼,认真学习贯彻习近平总书记在党史学习教育动员大会上的重要讲话精神,部署开展科协系统党史学习教育
由于移动协同网络连接的不确定性,协同操作到其他节点并非完全可达,传统基于操作转换思想的协同算法在移动协同环境下其协同操作的因果关系会有不一致现象发生。论文分析
文章对1995—2016年国外媒介与女性研究的SSCI文献,从研究者、期刊来源及研究对象等方面进行定量统计,并结合研究议题的归类分析,呈现国外媒介与女性研究的图景及演进.最后总
本文研究目的是基于新经济时代的背景,讨论管理会计发展所面临的机遇以及需要应对的挑战,采取调查研究、数据分析、案例分析等措施,结果是提出当前管理会计主要面临理论不完
Under the background of the Mobile Internet Age,location service has been developed rapidly.On the basis of modeling the space-time dimension and the study
近年来,随着我国社会经济的高速发展,行政事业单位所掌控的社会资源规模迅速扩大,单位财务内部控制也受到广泛关注.我国行政事业单位的财务内部控制制度在不断完善背景下,也
分析关于科技期刊编辑学研究的文献发现,2019年科技期刊编辑学研究在往年研究主题的基础上进行更加深入的探索,顺应新媒体的发展而聚焦于新时代编辑自身能力的提高,注重编辑