自动文摘技术的研究与应用

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:zhulixiao66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的进步和互联网技术的发展,网络信息量的频繁剧增,当今社会面临着信息大爆炸。当大量的信息像潮水般涌向人们时,传统人工处理信息的手段已经远远不足。为了解决这一问题,科学界提出文摘自动生成的技术。 自动文摘通常被视为自然语言处理的一项任务。文摘是准确全面地反映某一文章中心内容的简洁连贯的短文,与索引相比更能满足信息获取的要求。我国对自动文摘技术的研究目前还在初级阶段,但此技术所具有的重要作用是不可低估的,必将在未来的信息处理领域得到广泛的应用。 本论文基于现阶段的研究现状下,运用统计自然语言处理方法,首先对文章进行自动分词,利用停用词表对分词结果进行过滤,并利用知网(HowNet)获得概念,建立概念向量空间模型。通过计算词语重要度和句子重要度,系统得到一个粗略的文摘。最后再进行冗余计算,得到本文章的文摘。 本文在上述研究的基础上,设计了基于概念向量空间模型的自动文摘系统,实现了机器自动生成文摘的各个模块的功能,证实了本文利用概念统计的方法比基于词频统计的方法得到的文摘,能更准确含概原文章的中心内容。
其他文献
可扩展访问控制标记语言XACML(eXtendible Access Control Markup Language)是一种专门用于描述安全访问控制策略,具有可扩展性、可重用性、分布式和描述能力强等特点的语言
随着网络的迅猛发展,计算机技术的不断革新,以及PC机的普及,通过网络,计算机共享信息已经成为可能,但是由于信息化发展的不平衡,造成了信息资源的不一致,加上网络本身的复杂性给信息
在自然语言处理中,词性标注是最基础的课题。由于基于统计的方法具有不需要人工总结语言学规则、识别正确率高等优点,已逐渐成为研究的热点。在基于统计的方法中,隐马尔可夫模型
随着微电子技术和计算机技术的发展,实时电路可重构技术(动态重构)逐渐成为国际上计算系统研究中的一个新热点。它的出现使过去传统意义上硬件与软件的界限变得模糊,让软件拥
随着机器人技术的不断发展,对于移动机器人的研究也越来越多。同步定位和地图构建(Simultaneous Localization and Mapping,SLAM)问题是移动机器人实现真正自主的基础。目前
在电信事业蓬勃发展的今天,综合化、分布化、智能化已经成为电信网络管理技术发展的方向。电信管理网(Telecommunications Management Network,TMN)作为一个国际通行的电信管理
对于人员聚集场所,人员疏散的过程中存在很大的安全引患。采用最佳疏散方案在最短时间让人员到达安全场所,才能让更多的人避免死亡。对公共场所的人群疏散进行计算机仿真是具有
无线移动自组网(Ad Hoc)是一种特殊的无线移动通信网络,网络中的所有移动终端地位平等、自组织、无需事先布置任何网络设施或中心控制节点,具有网络拓扑结构动态变化、网络带宽
时间自动机是具有时间约束的有限状态转换系统,在实时系统进行形式化证明的过程中,先用它建模,然后再检验某些不安全状态是否可达。所以研究时间自动机及其验证技术,主要研究它的
在基于客户机/服务器(Client/Server,C/S)体系结构的社会保险管理系统中,更新和维护系统的工作十分困难;并且由于数据管理分散,存在于不同点上的重复信息经常导致信息数据的