基于概率统计和图的多文档自动文摘研究

来源 :全国第四届Web信息系统及其应用学术会议、全国第二届语义Web与本体论学术研讨会、全国电子政务技术与办公自动化学术研讨会 | 被引量 : 0次 | 上传用户：liuwanfu2006

【摘要】

：

本文介绍了一种新的多文档自动文摘方法。该方法的基本思想是通过估计词在文摘中出现的概率来选择最能反映多文档集信息内容的核心词，然后根据该概率计算核心词的权值，最后将整

【作者】

：

刘量谌卫军王建民

【机构】

：

清华大学软件学院北京 100084

【出处】

：

全国第四届Web信息系统及其应用学术会议、全国第二届语义Web与本体论学术研讨会、全国电子政务技术与办公自动化学术研讨会

【发表日期】

：

2007年期

【关键词】

：

概率统计和图方法信息内容多文档自动文摘文档集合核心词无向有权图基本思想概率计算数据集关系表重叠质量权值评测句子测试

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文介绍了一种新的多文档自动文摘方法。该方法的基本思想是通过估计词在文摘中出现的概率来选择最能反映多文档集信息内容的核心词，然后根据该概率计算核心词的权值，最后将整个文档集合中的句子及其信息内容重叠关系表示为一个无向有权图，从中连选出文摘句。本文利用DUC2003和DUC2004的数据集对该方法进行评测。测试表明，该方法所产生的文摘质量优于其它的一些方法比如LexRank.

其他文献

声誉管理系统的策略研究

本文主要讨论声誉管理系统中现有机制策略设计的不足之处，并且提出一种新的更换策略，比较两种不同的策略在相同环境中各自的特点并分析原因。

会议

声誉管理系统更换策略策略设计不足之处特点讨论机制环境分析

思考,设计,实施,反馈,改进——“塑料瓶净水装置”探索课程的五步教学法

本文通过对“净水装置”探索课程的详细介绍,分析了“五步教学法”的课程设计和教学策略,及其对学生形成和掌握科学的思维习惯与实践方法所具有的重要意义.

期刊

净水技术科学教育KWL表格

浅谈土木工程施工材料选择及质量控制的对策

期刊

施工材料选择原则质量控制问题对策

基于对象代理模型的地理信息建模方法

本文分析了地理信息系统、空间数据和空间数据库的特点，归纳了混合数据库模型、扩展结构模型、全关系模型、面向对象模型和对象关系模型等传统空间数据模型的优缺点，在对象建模

会议

基于一种有监督Isomap算法的Web中文文本分类

特征集约减在Web中文文本分类中具有重要的作用。等距特征映射(Isomap)方法是流形学习理论中一种广泛应用的无监督非线性降雏方法。本文根据Web中文文本训练集中已有的类别信

会议

Web中文文本分类等距特征映射多维尺度法可视化

Web应用程序的依赖性分析及其应用

随着Web技术的不断发展，J2EE、.net等新的Web集成框架的出现，基于Web的应用系统复杂性也在不断增加，这使得Web应用程序的可读性、可理解性受到很大影响。依赖性分析是一种重

会议

Web应用程序依赖性分析系统复杂性分析与理解依赖关系可理解性Web技术Web集成依赖图可读性框架方法J2EEnet

基于P2P缓存调度的视频流服务模型

利用P2P(peer to peer)视频缓存调度服务模型将传统的集中式VOD(视频点播)的服务分散化，从而消除传统的集中式VOD系统的瓶颈。为建立和保持多播树结构，论文采用新的缓存策略，视

会议

张伯苓的一次糊涂“爱国”

张伯苓是民国时期的大教育家，享有“南开之父”的美誉，对民族振兴作出了巨大贡献。但是，他却有过一次糊涂的“爱国”。事情是这样的：1948年6月，蒋介石先斩后奏致电张伯苓的学生、时任天津市长的杜建时，请他转告请张出任国民政府考试院院长。张伯苓以“年老体衰，素乏行政经验”等原因婉拒了，而国民党中常会则通过了任命。杜建时夹在中间左右为难，于是发动老校长的契友和他所器重的南开校友，对张伯苓进行了狂轰滥炸式的

期刊

张伯苓考试院院长邵飘萍蒋家王朝黄兴介公北洋政府爱人民势如水火教育救国

浅谈岩土深基坑工程监测技术与设备应用情况

期刊

岩土监测深基坑作用安全隐患

浅谈岩土工程勘察中常见问题及解决方法

期刊

岩土勘察分类及应用常见问题解决方法

基于概率统计和图的多文档自动文摘研究

与本文相关的学术论文