论文部分内容阅读
随着全球定位系统的飞速发展和广泛应用,以及社交媒体技术的发展,网络同人们的日常生活息息相关,大量包含空间位置数据的社交信息被发布到网络中,并且被感兴趣的人们从社交软件上捕获,以方便日常生活。这类社交活动拥有很强烈的空间局限性和信息及时性。人们的生活空间局限在某一个区域,该区域的信息能够更加强烈的影响生活在该区域的人民。同样,信息具有时效,接受信息的及时程度影响着人们的判断,所以如果能够及时的获取重要的信息,能够很大程度的方便人们的生活。这就是本文研究的发布订阅系统,发布者将信息发布到网络中,被订阅的人及时下载,能够极大的方便人们的日常生活。传统的发布订阅系统忽略了及时性的研究,并且对空间信息的利用不够充分。本文的发布订阅系统,基于一个拓扑模型,提出了一个可以在该分布式系统上应用的即时的发布订阅的算法,随后又提出了将自组织增量学习神经网络(soinn)应用在原始算法之上的优化算法,并且提出了在分布式系统上该算法的负载均衡策略,最后,又提出了该算法的一个哈希优化策略。具体内容包括以下几个方面:(1)即时的发布订阅算法:目前的该类系统算法,多是批处理算法,本文提出了一个分布式系统上的即时的发布订阅算法,统筹属性和空间信息,可以随着信息流及时更新聚类数据。(2)自组织增量学习神经网络的应用:soinn的自组织和增量学习的特性,在充分学习了自组织增量学习神经网络后,将之应用到本文的发布订阅算法上,对算法进行了时间和聚类效果的优化。(3)负载均衡策略:在分布式系统中,数据传输占据大量的时间,本文考虑到这一问题,对聚类的类别之间数据交换进行了一些优化策略,尽可能的降低了数据在不同节点之间的传输频率和传输内容的大小。(4)哈希策略:为了加快发布的数据和订阅的数据之间的比较,除了上诉的算法的优化,本文在比较这一步还提出了一个相适应的哈希策略,降低属性比较的次数,从而提高效率。(5)实验验证:本文使用真实的数据,在自建集群上,对提出的算法和优化策略进行验证,实验表明,本文的发布订阅算法在分布式的系统上满足了即时和自组织的特点。并且在时间上有提升。