基于向量空间模型的web文本自动摘要系统的研究

被引量 : 0次 | 上传用户:zhuangjun_1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和互联网技术的飞速发展以及广泛应用,万维网已经成为世界上最大的信息源,如何在这海量信息中搜寻所需要的信息、获取信息的主旨,如何快速阅读每天涌现出来的新信息,己经是一个迫在眉睫的问题。而自动文摘正是解决这一难题的重要应用。自动文摘是指利用计算机自动对文本编制摘要,是自然语言理解的重要应用领域之一。自动文摘也是一项极具难度和挑战性的工作,目前,国内外在这一方面的研究己取得了一定进展,本课题的研究目标是在对自动文摘技术进行深入研究的基础上,提出一种适合于web文档的自动摘要方法,并实际开发出一个基于向量空间模型的web文档自动摘要系统。本文的研究内容主要有以下几个方面:(1)概述了数据挖掘、web挖掘、web文本挖掘以及文本摘要的概念、特点和主要内容,并对文本摘要的方法和质量评价等关键技术进行探讨和研究。(2)基于向量空间模型的文本自动摘要研究。在对向量空间模型进行系统、深入的分析研究基础上提出了基于向量空间模型的中文文本自动摘要算法,并针对普通文摘中常出现的冗余问题进行处理。实验结果表明,本方法提取的摘要不受领域知识限制,能有效地去除冗余,更好反映文档内容。(3)在上述研究的基础上,设计并实现了文本摘要系统。建立了Web新闻文档自动摘要原型系统,以此作为深入研究文本自动摘要技术的实验平台。
其他文献
目的观察护理干预对风湿性心脏病患者围手术期焦虑心理状态的影响。方法采用焦虑自评量表(SAS)对80例风湿性心脏瓣膜病变患者在护理干预前、后进行调查。结果护理干预前患者
数控技术是现代装备制造业的基础,关系到国家战略地位和体现一个国家综合科技水平,也是国家中长期科技计划十六个重大专项中的关键技术。具有高速高精度控制、五轴联动插补、
论文主要围绕综合配套改革中的先行先试权展开研究,以先行先试权为研究对象,对先行先试权的权力特性、先行先试权的各种表现类型以及先行先试权的权力边界进行了细致的界定。
中国汽车行业起步虽晚但却发展迅速,虽然存在各种因素的制约和影响,但是它正在向着成熟市场方向迈进。根据历史数据的经验性分析可以看出,中国汽车行业将沿着发达国家走过的
文化缺省是指作者在与其意向读者交流时双方共有的相关文化背景知识的省略,是言语交际中常见的语言现象,同时也反映在文学作品中。从接受美学的观点来看,文化缺省在写作文本
三维模型的重构是整个逆向工程中最关键、最复杂的一环。在逆向工程中,三维模型的重构是利用产品表面的点云数据,通过插值或者拟合,构建一个近似模型来逼近产品原型。本文首
电子商务在我国的发展历程已有十余年,根据相关部门预测,每年新增人才需求将近75万人,电子商务专业人才就业前景十分广阔。我国每年有近十万电子商务专业本科生毕业,但培养出
注意缺陷多动障碍(ADHD)是一种起病于儿童期,并很可能延续至成年期,甚至终生患病的精神行为障碍疾病,对患者的生活影响很大。目前,针对ADHD的治疗,在诊断方面医学上尚无法给
<正>2014年成为我国尿素、氮肥等化肥行业的洗牌和提速年,有些肥料行业由于常年低迷而不得不进行洗牌,有些化学肥料行业则由于市场较好而走上了发展的快车道。那么,2015年及
背景:儿童前臂远端隆突样骨折一般无继发移位风险,文献报道可通过石膏管型、掌侧托、夹板、支具以及绷带等外固定物治疗获得满意疗效。但是不同外固定物治疗对患儿功能恢复及