一种新的基于段向量的文本自动摘要方法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:yanlingyanling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本自动摘要技术在网页搜索和网页内容推荐等多个领域都有着非常广阔的应用前景。经典的文本摘要算法采用统计学的方法来提取文章关键字,进而提取主题句。这种方法在一定程度上忽略了文本的语义和语法信息。近年来,分布式词向量嵌入技术已经应用到文本检索当中,基于该技术提出了一种词向量化的自动文本摘要方法,该方法主要分为4个步骤:词向量生成、基于词向量的段向量生成、关键词提取和主题句抽取,最终实现文本段落的自动摘要。实验结果表明,改进的文本自动摘要方法能够有效提取主题句。
其他文献
本文介绍了美国国家光伏标准ANSI 1703新防火测试的发布背景,光伏系统防火测试等级分类、测试条件、测试方法及测试方案。
美国、欧盟等相继出台了计算机产品的待机,关机和工作状态能耗要求,对国际贸易影响重大,本文就欧美等国家对计算机产品的主要能效要求和相关指标予以分析。
日前,享誉全球的产品安全事业领导者UL,与全球个人电脑市场的领导者联想PC产品集团签署了合作谅解备忘录,并达成多项备忘协议。基于全球战略合作伙伴的关系,UL与联想在原有业务的
近期,上海市质监局对全市所有获得室内环境污染检测资质的检测机构开展了“室内环境污染检测”能力验证活动,分为现场采样和盲样考核两个阶段。现场采样关注的焦点是甲醛、TVOC
从多角度拍摄同一物体所得不同视角图像中的关键点的匹配对图像三维重建至关重要。为了得到精准的角点匹配对,提出了基于图像尖锐度角点匹配的新算法。该算法分为3个步骤:第1,为最大限度避免噪声的干扰,使用Canny算子先检测图像,进而使用8邻域轮廓追踪算法追踪边缘点得到边缘轮廓线。第2,计算轮廓线的尖锐度获取图像中的关键角点。第3,先粗匹配利用零均值归一化互相关法建立不同图像角点间一对多的关系,再进行精匹
针对服务器中存储的大量重复和相似数据造成的空间浪费问题,改进的布隆过滤器(Bloom Filter)算法通过增加位数组并根据位数组的重复命中次数所计算的权重来动态优化重复数据的副
为了拉动内需,推广节能降耗,今年5月,国务院总理温家宝主持召开国务院常务会议,研究了促进节能家电等产品消费的政策措施。会议决定,安排财政补贴265亿元,启动推广符合节能标准的平
近年来,可穿戴设备被广泛地被应用于日常生活。用户量增加造成的可穿戴设备数据重发布是导致隐私泄漏的一个重要原因。为此,数据匿名化重发布方法受到了广泛关注。然而,现有的数
皮肤是人体最大的器官,面色相对于人体其他生物属性具有更便捷、更稳定的特性。因此,设计一个完整有效的面色分级系统是非常有意义的。本文中,面色分级系统被分为皮肤分割和面色分级2部分。针对皮肤分割任务,在生成对抗网络框架下搭建了一个多尺度特征融合网络,相对于传统的语义分割网络,本文的分割模型充分地利用了每一层特征图的信息。在面色分级实验中,首先在归一化rgb、HSV和Lab颜色空间下使用1 000幅图像
<正> S195型柴油机是目前广大农村中拥有量最多的一种机型。为使该机型在工作中发挥更大的威力,则应进行正确地调整。 1.调整供油提前角 S195型柴油机供油提前角为曲轴转角的