基于语义的单文档自动摘要算法

来源 :计算机应用 | 被引量 : 15次 | 上传用户:machao4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单文档自动摘要的目的是在原始的文本中通过摘取、提炼主要信息,提供一篇简洁全面的摘要。自动摘要的主流方法是通过统计和机器学习的技术从文本中直接提取出句子,而单文档由于篇章有限,统计的方法无效。针对此问题,提出了基于语义的单文本自动摘要方法。该方法首先将文档划分为句子,然后计算每一对句子的语义相似度,通过运用改进型K-Medoids聚类算法将相似的句子归类,在每一类中选出最具代表性的句子,最后将句子组成文档摘要。实验结果表明,通过融合语义信息,该方法提高了摘要的质量。
其他文献
研究改进了基于元胞自动机的一维NS交通模型,细化了元胞长度和时间步长,对静止车辆的加速能力进行了约束,用简单的方法解决了该模型中车辆的速度演化规则与前车速度无关的缺点。同时,考虑了交通密度对随机慢化概率的影响。计算机仿真表明:改进模型不仅得到了一些与其他元胞自动机模型共有的性质,且得到的基本图更加接近实测数据。
针对P2P环境下的联机分析处理(OLAP)查询节点数目不断增加时,易造成网络拥塞、查询效率降低的问题,提出一种基于社区划分的OLAP查询优化方案。该方案构建一个虚拟的社区网,并在此结构上设计了一种基于社区划分的多维数据集(CPDS)的OLAP查询优化算法。实验结果表明,该算法能有效避免因网络节点数目递增而导致的网络负载加剧问题,能有效地减少网络拥塞,优化了OLAP的查询效率,进一步提高P2P环境下
分析了我国传统体育文化的结构,认为我国传统体育文化的现代化风险主要集中在物质文化、制度文化、风俗习惯以及精神文化四个领域,并重点分析了其现代化风险特点。传统体育文
针对彩色逆半调图像提出一种基于空间信息的质量评价方法。首先,将图像变换到视觉均匀颜色空间S-CIELab空间,通过定义人眼感知色差图像和感知梯度图像,构造评价彩色逆半调图像质量的定量指标。仿真结果表明:该指标反映的结果符合人眼视觉特性,与人的主观评价结果基本一致,它为基于图像内容的彩色逆半调方法的设计提供了依据。
在分析IPSec协议数据处理基础上,提出采用嵌入式主处理器和协处理器分别处理IPSec协议中控制层面任务和数据层面任务的方案,并实现了一种基于S3C2510网络处理器和μCLinux操作系统的嵌入式IPSecVPN网关系统。
2016年6月底,国内首部二孩亲子漫画《大小捣蛋》正式出版,顿时风靡了妈妈圈,书中两个孩子间发生的诙谐、幽默的故事,让许多妈妈读完后坚定了要二宝的决心。老二的"大事"交给老
提出了一种基于切延迟椭圆反射腔映射系统(TD-ERCS)的图像加密方法,通过一组64bit的外部密钥和一个TD-ERCS混沌系统来实现。混沌系统根据外部密钥产生一组值域在[-1,1]的随机数,这个区间被分为32个部分并对应8种加密运算方式,像素每次的加密操作由当前随机数所对应的加密运算方式决定。在加密完24个像素之后,密钥被修改。该方案设计简单,能够实现任意大小图像的加密,数值实验和性能分析证明其
回族文化的传播,媒介的选择极其重要,在多种媒介并存的时代,一种文化传播的性质和水平,主要看其通过什么媒介传播。期刊媒介在回族文化的传播中具有独特优势,理应作为优先选择。以
高校辅导员和班主任的有效协作可以更好地开展大学生思想政治教育,促进大学生的成长与成才。通过调查研究,发现新疆高校辅导员与班主任协作中存在一些问题,通过对问题的分析,构建
从辞源学角度出发,探讨了运动、技能、技术等词的意义来源及发展演变过程。在收集大量的文献资料的基础上,对不同学科间有关运动技术、运动技能的概念定义进行研究整理,发现