基于粒计算的Web信息融合方法研究

来源 :武汉理工大学 | 被引量 : 2次 | 上传用户：yaomingjc

【摘要】

：

随着Internet的发展与普及,企业的运营日益扩展到Internet上,Internet已经成为世界上包含信息量最大、涵盖知识面最广的信息知识库,是全球信息传播的主要渠道,为人们提供了最

【作者】

：

余文艳

【机构】

：

武汉理工大学

【出处】

：

武汉理工大学

【发表日期】

：

2013年01期

【关键词】

：

Web挖掘粒计算 Web信息融合文本聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Internet的发展与普及,企业的运营日益扩展到Internet上,Internet已经成为世界上包含信息量最大、涵盖知识面最广的信息知识库,是全球信息传播的主要渠道,为人们提供了最有价值的信息源。Internet的迅速发展让Web信息更具多样性,人们在Internet这个广阔的选择空间中获得有用知识信息的同时也面临着巨大的挑战。传统搜索引擎存在检索结果信息冗余、不精准和碎片化的问题,用户不得不承受沉重的信息加工负担。信息融合技术已经广泛用于军事、经济和生物医学等领域,其在改善信息置信度、降低信息冗余度方面的能力为Web信息处理提供了新途径,已有的信息融合技术在处理结构化数据方面具有很好的发展前景,但是并不适用于具有非结构化、大容量并且动态变化的Web信息。基于以上问题,本文从“构造-集成”和“事件-索引”两个认知角度处理非结构化的Web信息,研究Web信息多粒度融合方法。借鉴现有的粒计算理论和Web信息融合理论,采用Web信息抽取技术抽取Web信息作为知识源,采用Web挖掘技术对Web信息进行深层挖掘,对Web信息进行提取及分析,将大量的、不确定的、非结构化Web信息转换为量化的、结构化的文本信息,研究Web信息多粒度融合模型和Web信息多粒度融合算法,主要的工作如下：(1)采用Web信息抽取技术抽取Web信息中包含的标题、正文、发布时间、信息来源等信息作为知识源,针对文本信息非结构化的特征,采用Web内容挖掘技术对Web信息进行内容上的深层挖掘,对文本信息进行量化表达；采用Web结构挖掘技术挖掘文本信息中的结构信息,设计包括概念、内容属性和链接结构属性的Web信息表示模型。(2)研究能反映知识的粒度性的构造-集成认知模型,结合模糊商空间理论从“构造-集成”认知角度设计Web信息粒度空间模型;研究能反映知识的关联性的事件-索引认知模型,针对Web信息的特征从“事件-索引”认知角度设计Web信息粒度关联模型；(3)研究文本特征权重计算方法,针对Web信息动态更新的特征,研究主题增量聚类算法；针对同—主题信息结合Web信息粒度空间模型进行多粒度划分及表示,研究信息粒度空间生成算法；分析Web信息的内容属性以及结构属性,结合Web信息多粒度关联模型研究Web信息粒度关联融合算法。并以新浪网中新闻中心的新闻信息为实验数据,进行了实例分析,证明了本文提出的方法是有效的。

其他文献

智能交通控制信号配时研究

随着我国国民经济持续、快速发展，机动车拥有量急剧增加，这为交通运输行业带来了繁荣景象。但是，大多数城市的交通却处于相当紧张的状态，交通拥堵已成为大城市突出的社会问题之一

学位

智能交通信号配时优化遗传算法聚类算法单交叉口

基于压缩感知的智能电表设计与实现

随着电子技术的不断发展,越来越多产生谐波的用电设备接入电网,而大量的谐波进入电网会影响电力系统的电能质量。如何对电能质量问题进行有效地分析和控制已经引起国内外相关领域的广泛关注。同时,智能电网的发展也对智能电表的功能运用提出了更高的要求,以实现电能管理系统信息化、自动化和互动化。新型智能电表除了能完成传统电表测量电量消耗的功能外,还能实时监测电压、电流、有功／无功功率等参数,分析电能质量,并能检测

学位

压缩感知智能电表数据压缩

煤岩声发射定位算法研究

随着深部煤炭资源的采掘和地下空间的开发利用，地下工程不断走向深部，特别是金属矿山及隧道工程，采深极大，岩爆事故剧增。在岩爆过程中产生声发射信号，该声发射信号中蕴含了丰富的

学位

煤炭地下开采采场动力灾害声发射定位传声器阵列广义互相关时延估计

SMS光纤结构传感特性研究

SMS光纤结构是一种近年来新兴的光纤器件，该结构光纤具有结构简单、易于实现、成本低廉、灵敏度高和无温度应力交叉敏感等特性。在光纤传感技术领域是一种继光纤光栅之后的具

学位

SMS型光纤器件光纤传感器级联结构温度应力多模干涉效应

智能机器人身份识别技术研究

身份识别技术作为人工智能领域中的一个重要方面，受到人们的广泛关注。尤其，随着具有身份识别功能的智能机器人的出现，该技术的应用领域得到进一步拓宽。但是，由于技术复杂、价格

学位

身份识别智能机器人人脸识别声源定位

基于DNA序列和NSCT变换的数字图像隐藏

随着互联网技术和通信技术的飞速发展，越来越多的重要信息如：卫星云图、军事图像、医学图像以及个人秘密图像都需要通过网络进行传输。但互联网是一个开放的环境，重要信息在网上

学位

图像隐藏NSCT变换DNA序列鲁棒性不可见性

基于通用仿真平台的多温区耦合控制系统的设计与仿真

基于实验教学、科学研究和工程应用的需要，本文设计了一套能够仿真控制系统的通用控制对象仿真平台和作为通用控制器使用的控制平台，并在两个平台上完成了三个系统的半实物仿真

学位

通用仿真平台角阵解耦补偿Smith预估补偿多温区耦合加热器啤酒发酵罐温度控制系统

基于面向对象的LTE系统级仿真平台的研究

LTE(Long Term Evolution)是一个新兴和有前途的技术，近年来又确立了其向4G发展的核心地位。然而目前在开源平台的资源方面却极度缺乏，严重的限制了不同研究群体评价整个LTE系

学位

LTE系统仿真平台性能评价小区用户蜂窝环境面向对象

基于车辆动态监管系统的内存数据库系统设计与实现

本课题来自于交通运输部全国重点运输车辆动态监管系统项目。近年来,为了减少交通事故的发生,加强对重点运输车辆的监管,各地方交管部门逐渐建立起基于卫星定位系统的车辆监

学位

重点运输车辆动态监管内存数据库接口

基于RBF神经网络的人体颅颌面多元特征信息提取技术研究

生物特征特征识别技术是现在公认的安全个人身份认证技术，目前，指纹识别、虹膜识别也已经应用于实际。能够用来进行进行身份确认的生物特征需要满足普遍性、唯一性、不变性、可

学位

生物识别颅颌面特征提取RBF神经网络

基于粒计算的Web信息融合方法研究

与本文相关的学术论文