【摘 要】
:
该文首先介绍了自动文摘的研究情况及存在问题,并给出了计算机自动文摘的一般模型.我们在具体的文摘系统实现时,应用了两种使用了自动聚合思想进行隐式章节划分的方法.该文从
论文部分内容阅读
该文首先介绍了自动文摘的研究情况及存在问题,并给出了计算机自动文摘的一般模型.我们在具体的文摘系统实现时,应用了两种使用了自动聚合思想进行隐式章节划分的方法.该文从如下两个方面进行研究:1.基于统计的方法.这种方法是借鉴于美国著名的情报科学家Salton的方法,该方法将自动分类的思想引入文本结构分析,通过统计每个段落的实义词(在这里作为特征词),这样得到了相应于每个自然段的特征词向量.在两两相邻的自然段之间作迪卡尔乘积(并不得到二元组,而是执行预定义的操作),将结果作为两个相邻段落的相关性的度量.于是一篇文章通过段落与段落的聚合构成了一个篇章结构网络.2.在统计方法的基础之上引入语义分析.这种方法是在Dtplotting方法基础之上引入了语义相似度计算,反语义相似度作为段落间相关性的度量,弥补了Dtplotting方法中语义信息不足的问题.该方法首先利用词频统计方法确定一个用坐标轴来表示的N维词空间,用二维同现矩阵来表示特征词库,其中列昨同归于尽表示坐标轴矢量,行向量表示特征词与构成词空间的坐标轴的同现频率.
其他文献
该文提出了两种不同的声控Windows应用程序的系统的解决方案.这两种方案采用不同的语音引擎接口和不同的后处理方法.第一种基于API方案的特点是用法简单,但是应用范围比较窄,
本文从知识及知识表示方法角度出发,对以往的计算机考试系统进行了全面的分析和讨论,从中找到这些考试系统的根本缺点,在于这些考试系统是封闭的考试系统,即这些考试系统均使用过
该文研究的重点是以分布式GIS中的QoS问题为出发点,通过对GIS服务质量因素、图层并发控制和空间索引结构等问题的研究,为进一步系统地研究分布式GIS中的QoS问题做铺垫.该文同
我们生活在一个信息过载的时代,网络技术的迅速普及和各种应用的丰富发展,使人们越来越多的使用互联网的服务,在互联网上积累了过于庞大的数据。“信息爆炸”是一个越来越引起人
随着网络技术的发展,各种网络应用在人们的生活中日益普及,人们可以通过网络共享信息,进行交流,处理生活和工作中的各种问题。虽然网络给人们的工作、生活和学习带来极大的方便,但
该文简要介绍了公钥基础设施的发展现状和应用前景,分析了PKI的体系结构和其提供的安全服务,介绍构建PKI系统中所用到的安全和编程技术,并提出了一个基于X.509协议的PKI系统
近年来,随着智能家居概念的普及,智能家居的发展越来越快,很多智能的家居用品如智能冰箱、智能洗衣机等都逐渐融入了人们的生活。一些IT界巨头Google、微软等都在智能家居领域投
社交网络已经成为人们日常生活的一部分,越来越多的人加入社交网络以方便和亲友之间的交流。他们通过社交网络共享文章、照片和视频等内容,发表对生活的感言、对社会事件的看法
本文首先介绍了电子邮件管理系统的现状,指出在系统的服务器端邮箱管理和系统用户信息管理以及系统的发布与恢复方面,仍存在着不足之处,并认为活动目录技术为解决这些问题提供了
将软件构件技术应用于操作系统领域,针对操作系统软件特有的特性,提出操作系统构件的概念,分析操作系统构件的特征,结合青鸟构件库技术,设计.开发操作系统构件库,是该文的工