基于相似性博客推荐技术的研究与应用

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:kornnay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0的应用,博客的传播速度得到了前所未有的发展,使其拥有巨大的信息资源。在数目如此庞大的博客系统中,用户想要找到自己最感兴趣的博客或博文,同时博主也想使自己的博客得到更高的访问量,就显得非常困难。博客搜索引擎的问世在一定程度上解决了这个问题,但是由于技术上以及对用户要求上的原因,不能真正满足用户的需求。本文研究了目前常用的推荐算法,并对博主的社会信息和博文信息进行分析,基于现有的技术设计了一种基于相似性的博客推荐算法,从博客的博文和博主的社会信息两方面的相似性来计算研究博客的相似度。本文在算法设计之前先介绍了博客的博文相似性和博主社会信息相似性的概念,并阐述了采用相似性方法的优点。构造了博主社会信息相似度和博文信息相似度的计算公式,并把二者进行了综合来计算总的相似度,对相似性权重值的确定采用线性结合法,并结合参考文献的内容确定其大小。实验部分采用开源爬虫工具(Heritrix)从新浪网上抓取相关的博客作为实验性数据,并对抓取回来的数据进行处理,然后将相关的数据信息存储到数据库中。对于改进的算法通过两种评价标准进行评估:一种是和文本算法对比准确率,这种方法适合于计算机进行自动测评;另一种是通过人工参与的方法,对推荐的博客与目标博客相似与否进行判定。通过对实验结果进行对比与分析,证明了改进算法的有效性,为博客推荐提供了技术支持。
其他文献
随着互联网和计算机网络技术的快速发展,人类进入了后PC时代。人们开始注重计算设备的便携性、个性化和智能化,要求计算设备具有某些专用功能并且易于使用。为了满足人们对计算
近年来,随着移动通信技术的飞速发展,基于位置的服务已经成为一个非常热门的领域。用户可通过基于位置的服务,了解某个地理位置点的名称,并能从互联网搜索得到大量知识。然而
作为下一代互联网的重要组成部分,物联网是实现云计算和普适计算蓝图的关键网络保障,旨在为用户提供任何时间、任何位置、任何事物、任何人之间的信息交流和智能控制。无线传感
光突发交换是光通信交换中最具发展前景的技术,其兼顾了光电路交换和光分组交换网络的优势,充分运用波分复用WDM(Wave length Division Multiplexing)光网络中庞大的带宽资源,有
近年来,基于手势识别的人机交互以其自然、丰富和直接的交互方式受到大家的青睐。针对传统手势识别准确率不高、鲁棒性不强的问题,本文从空间序列角度出发提出了基于递归图压
无线Mesh网络(Wireless Mesh Network,简称WMN),作为一种新型的无线接入技术,由于其易部署、非视距传输、良好的健壮性、结构灵活和高带宽等优势,近年来被广泛应用于各个领域。路由
量子神经网络是基于量子计算的基本原理与传统的人工神经网络而发展起来的一种研究神经网络的新方法。由于其独特的功能在某些问题上表现出来的巨大优势,越来越多的科研人员开
统计学习方法由于可以从语料库中自动的获取语言统计知识以用于构建统计模型,且在鲁棒性、准确性上均有一定的优势,因而在自然语言处理领域中得到了广泛的应用。然而,很多自然语
随着量子计算研究的进展,后量子公钥密码逐渐成为了密码学研究的热点之一。多变量公钥密码学是后量子公钥密码学的研究分支之一。由于多变量公钥密码体制尚未有适当的可证明