同构对称发布/订阅系统近似动态环匹配优化策略的研究与实现

来源 :东北大学 | 被引量 : 2次 | 上传用户:jueduizone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和交付服务的发展,物品交换、住房交换、和器官移植等在线交换服务,变得越来越方便和流行。这些在线服务作为同构对称发布/订阅系统的一类应用,在现代贸易和日常生活中起着越来越重要的作用。在同构对称发布/订阅系统的研究中,环匹配算法是关键问题之一。近似动态环匹配策略,用统计学方法分析订阅被匹配概率的分布规律,得到节省存储空间比例的预测公式,进而设定过滤阈值。解决了动态环匹配策略需要存储海量中间结果的问题,但是预测公式并不准确,而且只适用于订阅信息服从均匀分布的情况,为此本文提出了一种适用于任意数据分布的优化的近似动态环匹配策略。本文的优化策略,首先用概率学方法对预测公式的通用性进行优化,提出适用于任意数据分布环境的节省空间比例的预测公式;然后更加精确的分析订阅被匹配概率的分布特点,对预测方法的精度进行优化。同时分析订阅各维数据的分布情况,运用降维策略做进一步优化;最后,本文在仿真环境中做了多种性能验证试验,从数据分布、选择度、维度等方面分析实验结果,实验表明本文的优化策略得到的预测结果更加准确,精确度较未优化的近似动态环匹配策略提高了平均15个百分点。对于发布/订阅系统来说,如何让更多的用户参与匹配使系统利润最大化,以及为用户推荐前k个最优的环匹配以提高用户的满意度,是必要的也是有意义的。系统最优算法很好的解决了系统利润最大化的问题,能够得到包含最多订阅的环匹配结果集。但是关于为用户推荐前k个最优的候选匹配的研究很少。本文从面向用户的角度,首先扩展同构对称发布/订阅模型,设计候选环匹配质量的评价方法;然后提出了基于堆的top-k算法和基于败者树的top-k算法,并且从理论上论证了算法的可行性。最后本文从订阅数量、选择度、维度等方面对top-k算法性能做了验证,实验表明,基于败者树的top-k算法当选择度越大、订阅数越多、维度越小,与基于堆的top-k算法相比,性能越好。同时在有资源限制时,基于败者树的top-k算法具有更好的准确度。
其他文献
当今世界,随着Internet、Web数据库的越来越广泛的应用.全球信息化浪潮一浪高过一浪.在此形势下,电子商务发展迅猛,而作为B-to-C型电子商务的代表,网上商店的开发更是成为了一种
该文描述了决策支持和数据仓库的概念、结构和特点,分析了数据仓库设计的相关因素,包括数据粒度,数据分割,以及数据仓库提取数据的方法,时间戳方法,、增量文件方法和日志方法
论文在分析HFC网络现状和特有的树型拓扑结构和信道分配的基础上,提出了HFC网络安全亟待解决的安全问题:MAC层的安全机制,以保护用户数据在HFC网络中安全的传输:即:如何确定
该文通过分析已有的网络管理系统和技术,结合网络管理系统常见的两种体系结构,即集中式和分散式结构的特点,构造了一种基于WEB、数据库和CORBA的分布式网络管理模式,然后在该
该文以词汇语义驱动(LSD)方法为基础,采用符号规则系统与语料统计技术相结合的计算语言学方法,探讨如何构造面向机器翻译应用的、基于语言学知识的健壮的随机分析系统。
由于运动估计算法作为现在视频压缩的主要技术,在实现视频高压缩率方面起到重要作用,但由于其计算复杂度的影响,严重限制了其在实时视频编码领域的应用,因此对运动估计算法的
该文作者研究探讨了新型断层扫描方法,并对其算法作了改进,从而解决了此扫描方法所固有的计算量大及计算中零频率丢失的问题.传统的CT检测方法需要全方位的投影,层析投影合成
首先简要讨论了与CA认证技术有着密切联系的数据加密技术和公开密钥体制.CA认证中心是作为公开密钥基础设施(PKI)的一个重要组成部分而存在的,论文接下来对PKI的各方面细节作
随着数字产品和国际互联网的迅猛发展,保护数字产品版权的问题变得越来越突出,水印处理技术是解决这个问题的一个有效手段。 本文提出了一个利用环形自同构映射基于频域的数
本文主要论述了纺粘法非织造布生产过程计算机控制系统的设计、开发及研制,并通过查阅大量的国内外文献、资料,和对国内外几十家公司的产品进行了调研、比较后,决定采用分布式控