基于频繁聚类的Web Mashup模式挖掘研究

来源 :东北大学 | 被引量 : 1次 | 上传用户:sunna2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Mashup是一种面向最终用户的web应用模式,它通过聚合已有的web内容或服务来创建新的web应用,为用户个性化需求提供聚合服务从而满足多样化需求。然而随着应用数据源的快速增加,用户想要寻找到所需的Web应用变得越来越困难,并且缺乏对数据源之间关系的理解。如何协助最终用户寻找新颖的、适合的Mashup应用服务成为亟需解决的问题为了帮助用户方便的构建Web Mashup应用,本文提出一个基于频繁聚类的Mashup模式挖掘算法,在其基础上给出了一个面向最终用户的Mashup试验系统。论文首先提取web应用接口参数信息,对其进行参数化建模与匹配,形成候选应用参数项集。然后采用基于频繁分析的方法对参数项集空间进行挖掘,得到应用频繁的数据主题;对主题进行聚类分析得到Mashup核心数据,最后根据相关应用服务的功能相异度对核心应用频繁集进行新颖性过滤,得到Mashup结果。算法在多个实际数据集上进行试验分析,与实际结果相比,发现挖掘出的相关服务Mashup结果具有较高的准确性与可信性。在Mashup模式挖掘算法的基础上,本论文构建了一个Mashup试验系统。该系统针对不同用户类型的使用场景,提供不同的Mashup应用挖掘方法。系统不仅可以向用户提供创建混搭帮助信息,使他们创建的Web Mashup应用内容更加丰富,而且可以根据用户实际创建的Mashup修正已有的Mashup、补充新Mashup,使系统提供能更加新颖更加符合实际、更加丰富的Mashup。本文提出的算法综合了Mashup的构建特点,设计的系统可以为用户创建Mashup应用提供智能支持。
其他文献
当前,全球主要金融市场特别是外汇交易市场已经实现了网络化和计算机化。金融市场每天都在数据库中积累下海量的交易数据。如何利用计算机对这些数据进行有效的分析和研究,并加
伴随着信息时代信息量的膨胀,无论是网络信息、观测数据以及生物信息都存在着大量相似程度很高的数据。然而传统的压缩方法对于这种数据项之间差异量很小的数据没能够利用这
Web服务由于具有良好的封装性、松耦合性和高度的跨平台集成能力等优势,在网络上的应用越来越广泛。但是基于UDDI的服务发布与发现机制,仅提供语法层次的查找和匹配,很难满足
近年来,无线传感器网络(WSN)被认为是本世纪最具有发展前景的信息互联网络,不仅实现了物—物互相连接的信息通信,而且带动了网络智能化发展趋向。因此,研究无线传感器网络的
随着Web的发展,可供用户选择的Web服务越来越多。传统Web服务的组织和管理方法对服务质量缺乏有效支持,用户难以从众多候选服务中按质量选取最佳服务。现有的Web服务QoS (Qua
十九世纪九十年代初,人们开始对多媒体信息检索领域进行探索。其中,基于内容的多媒体信息检索成为了当时该领域上一个新兴的热点课题。同时也成为了计算机视觉领域中一个备受
作为一种重要的且具有代表性的数据结构,图通常可以用来描述不同领域的事物之间的繁杂关系。在信息化时代,快速增长的数据中的不确定性越来越普遍。如何对具有不确定性的图数
无线传感器网络是一种新形式的信息获得与处理的方式,在无线传感器网络中,由于无线传感器网络的分布性、资源有限性等方面的特性,众多的路由协议栈存在安全隐患,所以在无线传
随着传感器节点各方面能力的增强,WSNs(无线传感器网络)各项支撑技术的逐渐成熟,以及WSNs应用背景的迅速拓展,对WSNs的安全性与可靠性需求越来越强。在WSNs中,由于基于密码体
随着Web2.0应用的快速发展,标签在描述和搜索网络资源方面发挥着越来越大的作用。用户在发布或收藏网络资源时可以添加标签作为分类信息,形成了社会化标记和大众分类法。由于