自动文摘技术的研究与应用

来源 :长春理工大学 | 被引量 : 0次 | 上传用户：zhulixiao66

【摘要】

：

随着社会的进步和互联网技术的发展，网络信息量的频繁剧增，当今社会面临着信息大爆炸。当大量的信息像潮水般涌向人们时，传统人工处理信息的手段已经远远不足。为了解决这一问题

【作者】

：

柴晓丽

【机构】

：

长春理工大学

【出处】

：

长春理工大学

【发表日期】

：

2007年期

【关键词】

：

自动文摘知网概念向量空间模型自然语言处理

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着社会的进步和互联网技术的发展，网络信息量的频繁剧增，当今社会面临着信息大爆炸。当大量的信息像潮水般涌向人们时，传统人工处理信息的手段已经远远不足。为了解决这一问题，科学界提出文摘自动生成的技术。自动文摘通常被视为自然语言处理的一项任务。文摘是准确全面地反映某一文章中心内容的简洁连贯的短文，与索引相比更能满足信息获取的要求。我国对自动文摘技术的研究目前还在初级阶段，但此技术所具有的重要作用是不可低估的，必将在未来的信息处理领域得到广泛的应用。本论文基于现阶段的研究现状下，运用统计自然语言处理方法，首先对文章进行自动分词，利用停用词表对分词结果进行过滤，并利用知网(HowNet)获得概念，建立概念向量空间模型。通过计算词语重要度和句子重要度，系统得到一个粗略的文摘。最后再进行冗余计算，得到本文章的文摘。本文在上述研究的基础上，设计了基于概念向量空间模型的自动文摘系统，实现了机器自动生成文摘的各个模块的功能，证实了本文利用概念统计的方法比基于词频统计的方法得到的文摘，能更准确含概原文章的中心内容。

其他文献

数据库中RBAC数据到XACML策略的转换研究

可扩展访问控制标记语言XACML(eXtendible Access Control Markup Language)是一种专门用于描述安全访问控制策略,具有可扩展性、可重用性、分布式和描述能力强等特点的语言

学位

RBACXACMLXSLT/XPATHXACML策略转换XACML访问控制系统

基于Internet的数据目录服务的研究与实现

随着网络的迅猛发展，计算机技术的不断革新，以及PC机的普及，通过网络，计算机共享信息已经成为可能，但是由于信息化发展的不平衡，造成了信息资源的不一致，加上网络本身的复杂性给信息

学位

InternetLDAP目录服务XML多线程设计模式

应用于词性标注的隐马尔可夫模型参数评估

在自然语言处理中，词性标注是最基础的课题。由于基于统计的方法具有不需要人工总结语言学规则、识别正确率高等优点，已逐渐成为研究的热点。在基于统计的方法中，隐马尔可夫模型

学位

词性标注隐马尔可夫模型参数评估感知器算法

支持可重构硬件透明编程的操作系统研究

随着微电子技术和计算机技术的发展,实时电路可重构技术(动态重构)逐渐成为国际上计算系统研究中的一个新热点。它的出现使过去传统意义上硬件与软件的界限变得模糊,让软件拥

学位

硬件函数硬件透明编程可重构计算系统操作系统

基于g2o的SLAM后端优化算法研究

随着机器人技术的不断发展,对于移动机器人的研究也越来越多。同步定位和地图构建(Simultaneous Localization and Mapping,SLAM)问题是移动机器人实现真正自主的基础。目前

学位

SLAM后端优化闭环约束最小二乘法滤波

基于贝叶斯网络的电信管理网告警关联方法的研究

在电信事业蓬勃发展的今天，综合化、分布化、智能化已经成为电信网络管理技术发展的方向。电信管理网(Telecommunications Management Network，TMN)作为一个国际通行的电信管理

学位

告警纵向事件关联不确定性推理贝叶斯网络

基于力的虚拟人群疏散仿真模型

对于人员聚集场所，人员疏散的过程中存在很大的安全引患。采用最佳疏散方案在最短时间让人员到达安全场所，才能让更多的人避免死亡。对公共场所的人群疏散进行计算机仿真是具有

学位

人群疏散吸引力摩擦力排斥力计算机仿真仿真模型

Ad Hoc网络路由协议的设计与仿真

无线移动自组网(Ad Hoc)是一种特殊的无线移动通信网络，网络中的所有移动终端地位平等、自组织、无需事先布置任何网络设施或中心控制节点，具有网络拓扑结构动态变化、网络带宽

学位

移动自组网路由协议网络模拟NS2

时间自动机可达性检测方法研究

时间自动机是具有时间约束的有限状态转换系统，在实时系统进行形式化证明的过程中，先用它建模，然后再检验某些不安全状态是否可达。所以研究时间自动机及其验证技术，主要研究它的

学位

时间自动机可达性不同界限值矩阵复位点语义

基于MVC模式的Struts框架在社会保险管理系统中的应用

在基于客户机/服务器(Client/Server,C/S)体系结构的社会保险管理系统中,更新和维护系统的工作十分困难;并且由于数据管理分散,存在于不同点上的重复信息经常导致信息数据的

学位

客户机/服务器结构浏览器/服务器结构J2EEMVC模式Struts 框架社会保险

自动文摘技术的研究与应用

与本文相关的学术论文