论文部分内容阅读
随着互联网和交付服务的发展,物品交换、住房交换、和器官移植等在线交换服务,变得越来越方便和流行。这些在线服务作为同构对称发布/订阅系统的一类应用,在现代贸易和日常生活中起着越来越重要的作用。在同构对称发布/订阅系统的研究中,环匹配算法是关键问题之一。近似动态环匹配策略,用统计学方法分析订阅被匹配概率的分布规律,得到节省存储空间比例的预测公式,进而设定过滤阈值。解决了动态环匹配策略需要存储海量中间结果的问题,但是预测公式并不准确,而且只适用于订阅信息服从均匀分布的情况,为此本文提出了一种适用于任意数据分布的优化的近似动态环匹配策略。本文的优化策略,首先用概率学方法对预测公式的通用性进行优化,提出适用于任意数据分布环境的节省空间比例的预测公式;然后更加精确的分析订阅被匹配概率的分布特点,对预测方法的精度进行优化。同时分析订阅各维数据的分布情况,运用降维策略做进一步优化;最后,本文在仿真环境中做了多种性能验证试验,从数据分布、选择度、维度等方面分析实验结果,实验表明本文的优化策略得到的预测结果更加准确,精确度较未优化的近似动态环匹配策略提高了平均15个百分点。对于发布/订阅系统来说,如何让更多的用户参与匹配使系统利润最大化,以及为用户推荐前k个最优的环匹配以提高用户的满意度,是必要的也是有意义的。系统最优算法很好的解决了系统利润最大化的问题,能够得到包含最多订阅的环匹配结果集。但是关于为用户推荐前k个最优的候选匹配的研究很少。本文从面向用户的角度,首先扩展同构对称发布/订阅模型,设计候选环匹配质量的评价方法;然后提出了基于堆的top-k算法和基于败者树的top-k算法,并且从理论上论证了算法的可行性。最后本文从订阅数量、选择度、维度等方面对top-k算法性能做了验证,实验表明,基于败者树的top-k算法当选择度越大、订阅数越多、维度越小,与基于堆的top-k算法相比,性能越好。同时在有资源限制时,基于败者树的top-k算法具有更好的准确度。