基于分类的中文文本摘要方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:myevanlee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
是自然语言处理领域中一项重要的研究内容,根据实现方式的不同其分为摘录式和理解式,其中理解式文摘是基于不同的形式对原始文档的中心内容和概念的重新表示,生成的文摘中的词语无需与原始文档相同。提出了一种基于分类的理解式文摘模型。该模型将基于递归神经网络的编码-解码结构与分类结构相结合,并充分利用监督信息,从而获得更多的摘要特性;通过在编码-解码结构中使用注意力机制,模型能更精确地获取原文的中心内容。模型的两部分可以同时在大数据集下进行训练优化,训练过程简单且有效。所提模型表现出了优异的自动摘要性能。
其他文献
无流量计热量计量是一种新型的计量方法,它避免了有流量计热量计量在供暖水水质较差的情况下易坏并丧失准确性这一缺点;该计量方法只需测量温度,就能估算出流量并计算出热量;
不同的服务机器人在功能以及硬件组成上的差异使得软件结构也缺乏统一的规范,没有通用性;以正在研究的服务机器人实验平台为研究对象,分析并提出了一般的服务机器人软件实现结构
端口扫描是网络入侵过程中非常重要的一种攻击预探测手段;对端口扫描进行检测,发现可能出现的攻击行为,可以有效地配合入侵检测系统完成预警、拦截和取证等工作。在简要介绍了端
针对目前光碟管理装置空间使用效率低,操作复杂等缺点,介绍了一种基于单元模块化结构的新型光碟智能管理装置,包括模块化单元的机械结构、基于mega32单片机的控制器硬件设计总体
针对随机早期检测RED存在的网络带宽分配不公平现象,提出了一种主动队列管理算法,该算法是基于对高带宽流的抑制而实现网络带宽分配公平性的;通过对路由器丢包历史的分析,检测出
本刊讯:2011年10月20日,安捷伦科技公司(NYSE:A)宣布推出67GHzPNA—X非线性矢量网络分析仪,进一步扩展了其屡获殊荣的PNA-X系列。全新的67-GHz相位参考校准标准件也已上市,可配置为
为了提高嵌入式平台配置远程证明方案的效率,在基于Merkle哈希树存储结构的基础上,结合程序的局部性原理,考虑平台下程序验证的时间特性,对存储程序模块完整性度量值的数据结
介绍了一种飞控系统快速控制原型软硬件设计方案,该方案兼顾了数学仿真和半实物仿真两大功能;通过RT-LAB软件和通用硬件平台(工控机和数据采集板卡等)实现了将基于Matlab/Simulink
随着无线网络技术和移动智能终端的快速发展和普及,对群智感知的研究受到越来越多相关科研工作者的关注。群智感知利用众包的思想,将任务分配给拥有移动设备的用户(即感知任务
针对数字图像的版权保护问题,提出一种基于Fibonacci置乱的小波域数字图像盲水印方案。将原图像中的感兴趣区域(ROI)作为水印来源,以此提高水印的隐蔽性。在水印嵌入过程中,将原图像进行分块,对每个块进行Fibonacci置乱和离散小波变换(DWT),选择出低频子带,用于水印嵌入。同时,对水印也执行DWT,选择出低频子带,通过Fibonacci置乱得到置乱矩阵,将水印的置乱矩阵嵌入到主图像的块中