基于概率统计和图的多文档自动文摘研究

来源 :全国第四届Web信息系统及其应用学术会议、全国第二届语义Web与本体论学术研讨会、全国电子政务技术与办公自动化学术研讨会 | 被引量 : 0次 | 上传用户:liuwanfu2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了一种新的多文档自动文摘方法。该方法的基本思想是通过估计词在文摘中出现的概率来选择最能反映多文档集信息内容的核心词,然后根据该概率计算核心词的权值,最后将整个文档集合中的句子及其信息内容重叠关系表示为一个无向有权图,从中连选出文摘句。本文利用DUC2003和DUC2004的数据集对该方法进行评测。测试表明,该方法所产生的文摘质量优于其它的一些方法比如LexRank.
其他文献
本文主要讨论声誉管理系统中现有机制策略设计的不足之处,并且提出一种新的更换策略,比较两种不同的策略在相同环境中各自的特点并分析原因。
本文通过对“净水装置”探索课程的详细介绍,分析了“五步教学法”的课程设计和教学策略,及其对学生形成和掌握科学的思维习惯与实践方法所具有的重要意义.
本文分析了地理信息系统、空间数据和空间数据库的特点,归纳了混合数据库模型、扩展结构模型、全关系模型、面向对象模型和对象关系模型等传统空间数据模型的优缺点,在对象建模
会议
特征集约减在Web中文文本分类中具有重要的作用。等距特征映射(Isomap)方法是流形学习理论中一种广泛应用的无监督非线性降雏方法。本文根据Web中文文本训练集中已有的类别信
随着Web技术的不断发展,J2EE、.net等新的Web集成框架的出现,基于Web的应用系统复杂性也在不断增加,这使得Web应用程序的可读性、可理解性受到很大影响。 依赖性分析是一种重
利用P2P(peer to peer)视频缓存调度服务模型将传统的集中式VOD(视频点播)的服务分散化,从而消除传统的集中式VOD系统的瓶颈。为建立和保持多播树结构,论文采用新的缓存策略,视
会议
张伯苓是民国时期的大教育家,享有“南开之父”的美誉,对民族振兴作出了巨大贡献。但是,他却有过一次糊涂的“爱国”。事情是这样的:1948年6月,蒋介石先斩后奏致电张伯苓的学生、时任天津市长的杜建时,请他转告请张出任国民政府考试院院长。张伯苓以“年老体衰,素乏行政经验”等原因婉拒了,而国民党中常会则通过了任命。杜建时夹在中间左右为难,于是发动老校长的契友和他所器重的南开校友,对张伯苓进行了狂轰滥炸式的