Web文本挖掘的研究

来源 :兰州理工大学 | 被引量 : 13次 | 上传用户:ck2112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的发展使Internet出现了“信息丰富而知识相对匮乏”的问题。由于Internet的开放性及异构性,用户很难快速准确地从WWW上获取所需信息,因此,如何快速有效地提取所需信息是一项重要的研究课题。Web文本挖掘作为一种有效的信息检索技术,在近几年倍受研究者的关注。本文以此为研究重点,主要做了以下工作: (1) 探讨了Web文本挖掘的意义,系统地给出了Web挖掘的定义,对Web挖掘的任务进行了分类,讨论了Web挖掘与传统的数据挖掘、Web信息检索之间的关系。 (2) 系统阐述了Web文本挖掘的工作流程,重点研究了Web文本挖掘的特征表示、文本分类、聚类等相关技术,介绍了文本挖掘的研究课题及应用领域。此外,对Web文本挖掘系统WebMiner进行了系统介绍。 (3) 介绍了概念格的基本理论,探讨并研究了概念格理论在数据处理与分析方面的优势。深入分析了当前搜索系统存在的缺点,在Web文本检索中运用概念格理论挖掘文本中潜在的概念结构及概念间的相互关系,提出了一种基于概念格理论的Web文本检索方法。
其他文献
期刊
现代电子支援侦察(ESM)接收机和雷达告警接收机(RWR)尤其是反辐射导弹(ARM)的应用对雷达的生存构成了严重的威胁,低截获概率雷达正是在这种环境下提出的一种新体制雷达,它试
在准同步CDMA通信系统中,对所采用扩频地址码的要求是在同步误差范围内(零时延附近)具有理想的相关特性,零相关区域(ZCZ)序列就是能够满足这样要求的序列。本文在总结和比较
随着各种新兴通信业务的出现,终端用户的带宽需求不断提升,人们对网络系统带宽的需求持续增加。由于无线通讯的带宽需求持续增大,传统的电子技术已经无法满足传输速率提升的需求
本文主要阐述以人为本的护理模式在产科中的应用探讨,通过将住院部的环境营造人性化模式,以人为本为主的护患沟通方式的实施、产程过程中的陪伴、心理情感上的支持以及恢复过
目的:研究心理沟通对特需门诊患者的应用效果. 方法:将126例特需门诊患者作为研究对象(2017年7月30日-2017年9月30日期间收治),对所有患者进行心理沟通,观察特需门诊患者健康
期刊
近年来,随着信息技术的蓬勃发展,尤其是网络通讯技术、多媒体技术、数据库技术的发展,为企业和单位的电子公文流转提供了更为广阔的发展空间。在涉及到如何处理文档信息、如
期刊
当前,各种功能的嵌入式设备以其使用简便、面向特定应用、便于携带、微功耗、低成本等普通设备无法比拟的优势为亿万用户所接受。本论文涉及的方向感应加密系统和汽车导航系