基于Spark Streaming的动态社区发现及其在个性化推荐应用中的研究

来源 :江苏大学 | 被引量 : 2次 | 上传用户:zhucaiguai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区发现作为一种重要的网络分析技术,能够挖掘出网络中具有某些共性的节点集合。研究网络中的社区对理解整个网络的结构和功能起到至关重要的作用,它不仅可帮助我们分析及预测整个网络各元素间的交互关系,而且可以分析用户行为以及为用户提供更加个性化的搜索结果。现实中,社区发现已经在多个领域发挥着重要作用。本文在深入研究社会网络中社区发现算法、Spark相关技术以及个性化推荐技术的基础上,提出了基于叶子社区与节点比较策略的Louvain算法,并将改进的Louvain算法融入Spark Streaming流处理框架,使其能够动态调整社区结构,捕捉社区信息。最后将社区发现思想应用到个性化推荐领域中,用于解决大量的向量运算等问题。论文的主要工作如下:1.提出了改进的Louvain算法,包括叶子社区策略以及节点度数比较策略。其中叶子社区是指含有叶子节点且节点总度数为2n-1(n为节点数目)的社区,叶子社区策略是指直接将叶子社区中的节点划分到与之相邻并且度数小于或者等于2的节点所在的社区。节点度数比较策略则直接比较相邻节点的∑tot的值来找出maxΔQ的邻居节点。改进算法大量减少ΔQ值计算,提高了执行效率。2.针对Louvain社区发现算法仅适应于静态社会网络的问题,提出了基于Spark Streaming的动态社区发现框架(SDCDF),SDCDF中采用的动态社区发现策略减少了对整个网络进行社区划分的次数,提高社区动态发现效率。3.针对传统的电影推荐模型随用户与电影数量的增长导致向量运算过于复杂以及矩阵对系统内存开销大的问题,提出基于Louvain改进算法的电影推荐模型(LFRM)。LFRM依据Louvain改进算法的社区划分结果,将用户-电影矩阵转变成社区-电影矩阵,再使用ALS训练模型,并进行偏好值预测与电影推荐,该模型通过对用户-电影矩阵降维来避免大量的向量运算,一定程度上提高了个性化推荐的效率。
其他文献
随着我国社会主义市场经济体制的建立和发展,企业全面进入市场,成为市场竞争的主体,招标投标制度成为企业间市场竞争的一种重要方式,投标的成败已经对企业的销售额乃至整个企
由于Internet技术的广泛应用,各门学科应用特别是数据密集型、计算密集型的应用对广域网络中海量数字信息分析处理和协同合作能力的要求越来越高,为此人们提出网格计算技术,
本文对径向基(RBF)神经网络的各种串行在线学习算法进行了系统的分析研究,根据RBF网的原理与串行算法的特征提出了把分布式扩展卡尔曼滤波器(Decoupled Extend Kalman Filter
在现代社会中,随着互联网和无线互联网的发展,各种移动信息终端设备(如PDA, HPC)得到了广泛的应用,联机手写输入日益成为一种重要的输入手段。联机连续手写体字符识别是手写
人脸和掌纹识别是具有很高理论和应用价值的研究课题。掌纹中所包含的信息远比一枚指纹所提供的信息丰富,利用掌纹的线特征、点特征、纹理特征、几何特征完全可以确定一个人
基于图像序列的目标跟踪作为计算机视觉领域的一个重要而富有挑战的课题,得到了广泛而深入的研究,然而长期以来大部分工作都集中在对人或者类似汽车飞机的机动目标的跟踪上。
大多数嵌入式系统的开发,由于目标机和宿主机使用的是不同体系结构的处理器,因此无法在目标机上运行和测试目标程序,通常需要建立一个交叉编译环境,将编译后的可执行代码下载
设计模式和应用框架都是软件复用的方式,框架可看作是一系列具体化的设计模式的组合。Struts框架是工作在J2EE平台上WEB层的应用框架。虽然对Struts框架的运行机制和控制器的
遥操作机器人系统被广泛的运用在各行各业,而基于Internet的遥操作机器人系统由于方便操作、控制等优点被大量采用。文章从Internet的特性出发,认为时延是由网络产生的。不同
人耳具有结构稳定丰富、不受面部表情的影响、更容易采集、更容易为人接受、不容易欺骗等优点,因此人耳识别正在成为生物特征识别领域中的又一热点。目前人耳识别正处于起步