基于Web的文摘技术研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:az4112513
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web文档的迅猛增长使Web文摘技术成了当今的一个研究热点。由于Wed文档的特殊性.使得Web文摘不同于传统的文本自动文摘。本文分析了Web文档的特点;给出了Web文摘的定义;提出了基于句子抽取的Web文摘生成算法。算法中将每个Web句子权重分解为Web特征词权重和Web句子结构权重,并用机器学习的方法来计算二者所占的比重。Web特征词权重根据文档分类树图进行权值调整,Web句子结构权重充分考虑排版格式和超连接属性。通过对1000篇Web文档的文摘实验,证明文中所提Web文摘算法切实可行。
其他文献
陈立夫是20世纪中国的重要人物之一,大半生纵横政海,曾历任蒋介石机要秘书、国民党中央组织部部长、国民政府教育部长等各项要职。国民政府迁台后,他移居美国,潜心研究中华文化,推动中医药的发展并使国际认可。2001年,陈立夫去世,享年101岁。   2000年9月6日是陈立夫先生的百岁寿诞,他将多年亲身经历所得整理成《我怎么会活到一百岁》,详述了养生之道。     一、先天的禀赋   先天的禀赋,
期刊
一个家庭居家过日子,自然离不开“盘算”,要盘点成本花销,也要算计收益所得。一个国家的治理与发展,自然就更需要“盘算”,要核查自身的资源禀赋、生产要素及其投入,也需要核算国民
阳光灿烂的夏日你想穿吊带衫、迷你短裙、无袖小背心吗?想让裸露的四肢洁白柔嫩吗?想让自己明艳美丽,光彩照人吗,那么,一项最重要的前期工作——脱毛是千万不能忘的。
电视剧《美丽会说话》是由采丽源公司投资拍摄的一部青春、励志、幽默轻喜剧,是展现美容行业朝气蓬勃、欣欣向荣的一个美丽窗口。《财智》将携手采丽源公司与观众朋友一起欣赏
在2009年新的竞争形势下,中小美容企业如何赢得市场?《财智》名家专栏特请著名营销策划人李志起先生用理论结合案例的形式,为大家深入剖析市场,并提出建议及策略。每期一个关键词
上世纪七十年代末,世界主要发达国家创业投资经过蓬勃发展,与当时的经济发展形势相适应,开始转型、孕育出新型的投融资机制,出现了PE(私募股权投资基金)这一金融载体,对所在国家经济
以SWOT模型为分析工具,分析公务员激励机制所面临的外部机会和威胁,内部优势和劣势。并在此基础上,得出完善公务员激励机制的劣势—机会策略(WO)策略,具体措施为:借鉴企业人力资源管理中激励机制的经验,促进激励机制形式和手段的多元化;树立“以人为本”的激励理念,促进人才流动的灵活性;建立科学公正的绩效评估体系,为激励机制的完善提供依据。  激励,用心理学来阐释,即激发人的动机产生某种行为,从而达到既
准确的文档语言模型估计对于改善语言模型检索系统的性能是非常重要的.在本文中我们提出了基于主题语言模型的信息检索系统,首先设计了"改进的两阶段K-Means聚类算法"来对文
文本推理在自然语言处理的应用中占有极为重要的位置,本文介绍了基于知网的一种推理方法,该方法以语义网络的形式表示知网中的知识,利用“标记传递”实现推理。其特.最是引入构造
理论上将天然气转化为液态烃可通过沸石催化剂在高温下完成,但反应受两个主要因素的阻碍。向产物的转化受热力学限制,并且在沸石表面上形成焦炭导致催化剂活性快速降低。涉及陶