社交网络信息检索的多维度排序优化算法的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zhenzhurujun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络是互联网上与其他人相联系的一个平台,已经成为网络时代的一个重要标签。通过社交网络,用户可以即时的分享文字、图片、音频和视频,其使消息的传递呈指数级增长。因为其具备及时性、共享性、交互性等特点,社交网络深入人们生活的各个方面,并已经成为人们获取信息的一个重要的来源。据调查,全球80%的网民都在使用社交网络,每分钟互联网上都会产生海量的社交网络数据。面对大量的社交网络数据,有效的对其进行检索、定位出符合用户期望的数据是十分重要的。传统的检索排序模式,利用检索关键字出现的频度与位置对检索结果进行打分,表示检索结果与查询词的相关度,并将多条检索结果按照这个相关度递减排序返回给用户。但是社交网络数据具备一些不同于传统数据的特点,例如其具备时间属性、传播度等,这些附属信息会影响数据的价值,但并没有在检索排序中被考虑进来。同时,检索用户真实意图的分析一直是检索排序系统的一个研究热点,如何从相同的检索关键词中分析出用户真实意图,从而给出更加符合用户意图的检索排序结果,这是实现高效检索系统的关键。最后,针对不同的系统应用服务,不同类别的数据也体现出不同的价值,在金融检索系统中,分类为金融相关的检索结果应该被认为具有更高的价值,这点也需要被考虑到。本文首先阐述了论文的研究背景,介绍了社交网络和数据检索的相关知识,概要描述信息检索和数据处理、存储的相关技术。接着对主要检索排序算法进行分析,并着重分析了社交网络数据的特点。基于以上两点,本文对社交网络数据检索排序进行了需求分析,并提出一种多维度检索排序优化算法,从数据特点、用户意图和应用特点三个维度对原始检索排序结果进行优化。最后本文基于金融微博数据对此优化算法进行了实现,详细介绍了算法实现的基本架构以及关键模块的设计,并进行了相关的测试和分析。
其他文献
传统中药益母草自古以来在中国一直被用于妇产科疾病的治疗,而近30年来研究表明,其生物活性是多种多样的,尤其是对心血管疾病显示良好的疗效。动物实验以及临床研究表明,益母
近年来,城市中的土地开发已达到饱和状态,城镇周边近郊的土地就成为土地征收的主要对象。这一变化的直接结果就是导致涉及农村土地征收补偿分配的纠纷只增不减。本文主要从出
随着老龄化社会的加剧,人口结构悄然变化,这种人口变化已经在各个方面对个人、社区、国家和国际环境产生了深刻的影响,并且使人类的每一方面包括社会、经济、政治、文化、心理和
目的:通过对体育院校拉丁舞队员不同训练阶段体成分的各项指标以及能量消耗变化的测量分析,为运动员的训练及比赛维持一个相对稳定的能量消耗标准,提供参考依据。方法:本文采用
《轮回》是美国导演兼摄影大师朗·费里加于2011年拍摄并上映的纪录影片,整部纪录片都体现了“新纪录电影”的特点。《轮回》中大量采用了延时摄影、移轴摄影、人像摄影等摄影
随着社会的发展进步,商业街作为城市生活的重要组成部分,从单一的为居民提供购物场所,逐步转变为为他们提供购物、娱乐、休闲、交往等多元化活动的生活空间。在快速城市化的背景
海上货物留置权制度作为重要的海上贸易法律制度之一,其关乎到能否保障债权人的债权,还对能否维护债务人的正当权益起到影响。但是,我国《海商法》中,依然没有完善的海上货物
随着汉语热在世界范围内的升温,越来越多的孔子学院和孔子课堂在全球各地相继成立。其中在欧洲中部的波兰与中国近年来经济文化交往愈发密切频繁,在波兰至今己成立了四所孔子
目的:明确IL-24对体外培养的白血病骨髓单个核细胞(BMMNC)增殖和凋亡的影响,初步探讨IL-24诱导BMMNC凋亡的可能机制,为临床白血病的治疗提供理论依据。方法:(1)收集石河子大学一附院
党的十八届三中全会明确提出国企红利上缴比例到2020年提高至30%。国企红利作为重要的公共资源载体如何实现合理共享,让全国人民从国企溢价中受益,不仅是学者关注的焦点也是