基于空间文本信息流的分布式的发布订阅系统

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yangbao_2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球定位系统的飞速发展和广泛应用,以及社交媒体技术的发展,网络同人们的日常生活息息相关,大量包含空间位置数据的社交信息被发布到网络中,并且被感兴趣的人们从社交软件上捕获,以方便日常生活。这类社交活动拥有很强烈的空间局限性和信息及时性。人们的生活空间局限在某一个区域,该区域的信息能够更加强烈的影响生活在该区域的人民。同样,信息具有时效,接受信息的及时程度影响着人们的判断,所以如果能够及时的获取重要的信息,能够很大程度的方便人们的生活。这就是本文研究的发布订阅系统,发布者将信息发布到网络中,被订阅的人及时下载,能够极大的方便人们的日常生活。传统的发布订阅系统忽略了及时性的研究,并且对空间信息的利用不够充分。本文的发布订阅系统,基于一个拓扑模型,提出了一个可以在该分布式系统上应用的即时的发布订阅的算法,随后又提出了将自组织增量学习神经网络(soinn)应用在原始算法之上的优化算法,并且提出了在分布式系统上该算法的负载均衡策略,最后,又提出了该算法的一个哈希优化策略。具体内容包括以下几个方面:(1)即时的发布订阅算法:目前的该类系统算法,多是批处理算法,本文提出了一个分布式系统上的即时的发布订阅算法,统筹属性和空间信息,可以随着信息流及时更新聚类数据。(2)自组织增量学习神经网络的应用:soinn的自组织和增量学习的特性,在充分学习了自组织增量学习神经网络后,将之应用到本文的发布订阅算法上,对算法进行了时间和聚类效果的优化。(3)负载均衡策略:在分布式系统中,数据传输占据大量的时间,本文考虑到这一问题,对聚类的类别之间数据交换进行了一些优化策略,尽可能的降低了数据在不同节点之间的传输频率和传输内容的大小。(4)哈希策略:为了加快发布的数据和订阅的数据之间的比较,除了上诉的算法的优化,本文在比较这一步还提出了一个相适应的哈希策略,降低属性比较的次数,从而提高效率。(5)实验验证:本文使用真实的数据,在自建集群上,对提出的算法和优化策略进行验证,实验表明,本文的发布订阅算法在分布式的系统上满足了即时和自组织的特点。并且在时间上有提升。
其他文献
总结和研究了在民用飞机采用变频供电的趋势下,燃油系统主供油泵的几种解决方案。并对每种方案的优势和劣势进行了梳理,并对它们对于燃油系统设计的影响进行了权衡分析。 Su
笔者在批改调查问卷、调查报告等表格类基础写作中。发现学生对数据的表达,尤其在呈现百分比时,句式单一,结构混乱,语法错误较多,以至影响分数。本文以如何正确表达百分比为中心,通
社会的科技化,使得照片档案无处不在,本文根据自己多年的工作经验,试着从港口企业照片档案的产生与收集;港口企业的照片档案分类;港口企业照片档案的归整三个方面,浅谈一下工作体会
高考在即,如何让考生高效地复习英语,是英语教师们共同努力的方向,广东省高考英语的写作题高达40分,这部分我们应当格外重视。为了提高英语整体水平,我们必须让所有考生有话可写。在多年的英语教学中,我归纳了两个实用的写作拿分模板,仅供参考。  一、对比观点型  [模板](时间),we had a discussion on 讨论的问题 in 调查范围. 百分数(如30%)of the 对象 say y
问题:已知函数f(x)=ax3+bx2+cx(a,b,c∈R)在区间【0,1】上是增函数,
随着SoC设计复杂度的提高,验证已成为集成电路设计过程中的瓶颈,而FPGA技术的快速发展以及良好的可编程特性使基于FPGA的原型验证越来越多地被用于SoC系统的设计过程。本文讨论了GPS基带的验证方案以及基于FPGA的设计实现,并对验证过程中的问题进行了分析,并提出相应的解决办法。
本文通过对近年来一些高校开展的岗位分类管理实践进行梳理后指出,实行岗位分类管理是推动实现岗位管理的有效途径;实行岗位分类管理重在体系建设,以推动人事管理创新机制的再造
中国正在成为最具发展力的银行卡产业大国,但总体上看,我国银行卡产业发展还处于初级阶段,存在着受理市场发展滞后、相关法律制度建设滞后等问题。本文主要分析我国银行卡产业发