一种基于聚类算法的主旨句提取方法

来源 :情报学报 | 被引量 : 0次 | 上传用户:qianchuanzhishui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动文本摘要中一个关键的步骤是确定文章的主旨并将反映文章主旨的句子提取出来。在讨论分析kmeans,k-medoids等聚类算法的基础上,根据对文本摘要的实际要求以及文档自身的特点,提出一种基于聚类算法的主旨句提取方法。实验结果表明,在提高聚类准确性的基础上,新方法较其他聚类算法能够更加有效地避免遗漏主题的问题,能较全方位地反映全文的主旨,提取出的摘要既覆盖全面又突出重点。
其他文献
为改进引文分析方法在探测学科期刊群落结构中的应用,以我国经济学期刊为例,运用社会网络分析法中的相关理论与方法,测度经济学期刊互引网络的结构层次。包括利用中心性分析
高等级公路测量中,为确定导线点的质量及精度是否符合规范及有关规定要求,需要经常对导线点进行复测并且进行平差计算,但由于附合导线存在“回头”现象,角度平差公式此时会不具普
本文在对非相关文献知识发现中的关键技术进行界定的基础上,对11个国外主要的非相关文献知识发现研究中所涉及的关键技术,即初始文本集的构建、信息抽取及中间关联词的确定与排
介绍了高速公路试验监理的重要性,阐述了试验监理的职责、内容以及方法和程序,指出在高速公路建设中,试验监理是质量控制最重要的环节。
在XML文档的信息检索中,检索质量不高的一个主要原因是用户难以提出准确描述其查询意图的查询表达式,而查询扩展技术被认为是可以帮助用户构建符合其查询意图的查询表达式。
周期平稳信号盲源分离方法是在没有先验知识的前提下,从一组采集信号中提取未知源周期平稳信号。对混合的周期平稳信号进行盲源分离的算法进行研究。根据循环平稳度的特征,提出
本文利用《中国科技期刊引证报告》,重新计算了其中几个学科的一些期刊除去自引后的影响因子,并对去除前和去除后的影响因子与期刊排名进行了对比,以考察期刊自引对影响因子和期
目前迫切需要在非医学专业用户词和医学专业术语之间建立关系,使用户可以通过非医学专业用词找到其对应的精准的医学专业术语。构建用户健康词表(Consumer Health Vocabularie
对超流态混凝土灌注桩的工艺原理、工艺特点作了简述,详细介绍了该桩的适用范围及施工要点,指出超流态混凝土灌注桩适用范围广,操作简便,混凝土灌注速度快,造价低廉,具有广阔
从连续刚构桥主桥箱梁施工、悬臂段灌注、边跨直线段施工、合拢段施工等多个角度介绍了连续刚构桥箱梁施工的全过程,对同类工程具有借鉴和参考意义.