基于整子多智能体的社会化搜索引擎模型及关键技术

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xin__yonghu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web 2.0时代的到来,在线社交网络应用迅速普及,大量用户涌入在线社交网络平台发表见解、分享生活,产生了大量用户生成内容。这些数据对于提高搜索服务的质量与体验具有重要意义。在此背景下,旨在利用社交网络数据优化搜索结果,提升搜索服务用户满意度的社会化搜索引擎应运而生。然而,已有社会化搜索引擎研究仍然存在4个问题:(1)检索资源大都集中于特定的在线社交网络平台,导致信息检索查全率不高;(2)被动响应用户搜索请求,仅通过用户兴趣、亲密度等知识,研究具体结果排序算法的分析设计,个性化程度并不能令用户满意;(3)忽略了社交网络数据实时变化的特点,无法保证社交网络知识的新鲜度;(4)研究内容局限于算法分析与社会化搜索模式、机理的探讨,缺乏系统模型的设计。因此,针对社会化搜索引擎面临的“检索范围局限、知识应用不足、缺乏社交网络知识的主动更新机制,以及研究碎片化、缺乏模型设计”问题,本文提出了一个面向全网检索资源、支持任务自适应调度、基于整子多智能体的社会化搜索引擎模型,能够利用多种在线社交网络知识优化全网搜索引擎的检索结果,向用户提供个性化的检索结果列表,主动推荐感兴趣的多样化信息。本文的创新性成果主要包含4个方面:(1)提出了一个支持任务自适应调度、面向全网检索资源、基于整子多智能体的社会化搜索引擎模型。本文从任务角度出发,设计了整子多智能体系统符号化模型,在设计Holon结构、建模任务相关信息的基础上,探讨了系统的自适应机制以及任务分配方法。实验结果表明,本文提出的自适应机制能通过对执行单元的竞争力调整以及结构调整,帮助系统适应新的环境需求。该方法尤其适用于解决因部分计算节点失效引起的环境异常,通过调用处于空闲状态或正常状态的执行单元,以协助异常执行单元完成任务,保证任务执行的成功率,提高系统的鲁棒性。(2)设计了一种社交网络数据变化主动感知策略以及社交网络知识主动更新机制。通过分析用户在社交网络平台的行为习惯,设计相应感知规则,主动感知用户社交网络数据变化,考虑到用户行为存在不稳定性,提出的社交网络数据变化感知策略,能够根据用户行为不断学习新的感知规则。在此基础上,为了降低不必要的知识更新引起的系统开销,采用基于阈值的方法判断社交网络数据的变化是否引起知识变化,适时更新相关知识,以保证社交网络知识的新鲜度。实验结果表明,本文提出的方法对于社交网络数据变化的更新率达到了92.6%,社交网络知识的更新率达到了72.5%,能够满足用户的个性化搜索需求。(3)提出了一种基于查询分类的多特征融合结果排序方法。该方法将用户提交的查询词分类处理,针对非导航类查询词,融合用户与网页文档之间的主题相似度,用户兴趣关键词与网页关键词相似度,文档在搜索引擎中返回的位置,成员搜索引擎返回结果的数量等多个特征,为用户提供个性化的检索结果列表。扩展查询词时,在考虑了成员搜索引擎对于文档相关度评分的基础上,融合用户兴趣社团成员的点击记录,以及社团成员在用户兴趣领域的影响力,确定查询伪相关文档,扩展用户提交的查询词,帮助用户更好的表达查询意图。实验结果表明,提出的结果排序方法对于信息类查询词的NDCG均值达到了0.677,对于事务类查询词的NDCG均值带到了0.706,与参照方法相比,具有较高的查准率。(4)提出了一种基于社交网络知识的多样化信息推荐机制。通过为用户提供个性化的结果推荐、热点推荐以及用户推荐服务,建立知识与知识之间的连接,以及知识与人之间的连接。结果推荐方法通过用户的兴趣社团、交互社团、社交社团成员的查询记录,以及社团成员与当前用户的最短路径,为当前用户推荐可能感兴趣的网页文档。热点推荐方法根据用户兴趣的主题分布、用户的兴趣社团成员以及交互社团成员的点击记录向当前用户推荐可能感兴趣的热点。除此之外,提出的信息推荐机制,能够根据用户提交查询的所属领域,帮助用户找到该领域内影响力用户以及非领域用户。实验结果表明,本文提出的结果推荐方法关于信息类查询的MAP值达到了0.743,事务类查询的MAP值达到了0.731;提出的用户推荐方法的相关性分值达到了0.709;提出的热点推荐方法,MAP值达到了0.750。与参照方法相比,本文提出的推荐机制准确率更高,能够主动帮助用户发现所需资源。本文围绕现有社会化搜索引擎存在问题,开展了社会化搜索引擎模型的整体设计及算法、机制、策略等关键技术的研究。所提出的面向全网社会化搜索引擎模型,社交网络知识的主动感知与更新机制,以及基于社交网络知识的结果排序方法与多样化信息推荐机制,能在一定程度上提高社会化搜索引擎的查准率。
其他文献
流形优化在应用数学、统计学、工程、机器学习等领域有着广泛的应用.利用流形的拓扑结构和几何性质,可以将线性空间上的约束优化问题看做流形上的无约束优化问题;通过引入适当的黎曼度量,也可以将线性空间上的非凸优化问题转化为流形上的凸优化问题.许多实际应用中数据的自然结构常常建模为约束优化问题,其约束是黎曼流形.为此,人们一方面研究子流形的拼挤性质以简化数据的建模结构.另一方面研究黎曼流形上的优化理论继而构
人们对于世界的认知往往是通过二维以及三维图像。当下,人们对图像信息质量的要求越来越高,但是由于一些客观因素比如遮挡,反光,暗环境等条件,设备难免会采集到低质量的图像图形信息。这些低质量的图像一方面对人类视觉系统不友好,另一方面也不利于计算机视觉的下游任务,诸如图像分类,图像分割,目标检测等。所以,对低质量的图像图形信息进行修复是十分有必要且有意义的工作。类似的,三维图形也可能由于扫描角度限制等问题
大数据时代需要存储和处理的数据量呈现爆发式增长,而传统基于浮栅结构的存储器和基于冯.诺依曼构架的计算器已经达到技术瓶颈,发展逐渐变缓,因此寻找新的存储器件取代现有的浮栅式存储器以及发展新的计算系统已经成为学术领域和工业领域关注的重点。忆阻器尤其是阻变忆阻器因其速度快、能耗小、集成度密高、保持时间长以及能够实现对神经突触功能模拟等优点,被认为是下一代存储器和类脑计算网络最有力的竞争者。本文以基于Hf
微波光子学技术可用于实现微波信号产生、传输、处理、控制、变频等功能,是下一代无线通信、雷达探测、卫星通信、深空探测、卫星有效载荷以及电子战等领域不可或缺的重要模块;其可广泛用于高频微波信号产生、光纤色散补偿、镜像抑制、多普勒频移(Doppler Frequency Shift,DFS)测量等技术。而随着电子系统业务量的增加,信息传输速率的要求也越来越高,且现在系统越来越向高性能、一体化、多频段信号
海杂波是对海雷达照射海面接收到的后向散射回波,基于匹配统计模型的海杂波特性精确估计理论是不同对海雷达探测工作中实现有效目标检测及跟踪过程的关键基础。在高分辨率、低擦地角的对海雷达工作场景中,利用纹理分量服从不同概率分布的各类复合高斯模型可以有效地描述海杂波回波的统计特性,其中包括K分布模型、广义Pareto分布模型(Generalized Pareto Distribution Model,GPD
为了便于系统分析与综合,人们通常需要对物理系统进行一定层次的简化及抽象,并在此基础上建立相应的数学模型。离散事件系统是人们对异步发生的离散驱动的物理系统的一种抽象。随着信息化水平的不断提高,特别是数字计算机控制的制造技术的不断发展,离散事件系统大量涌现,如通讯网络、柔性制造系统、物流管理系统以及火车和航空调度系统等。这些系统都是典型的离散事件系统,这些系统中事件的发生都具以下共同特征:异步性、顺序
随着互联网、物联网等技术的飞速发展,在社会生活的各个领域,涌现出海量的多视角数据。多视角数据指的是同一对象从不同途径或不同层面获得的特征数据,其呈现出多态性、多源性、多描述性和高维异构性等特点。例如自动驾驶中,车辆通过摄像头、激光雷达等多个传感器收集到的多视角数据感知周围环境。多视角学习方法利用了视角之间信息的互补性,对多视角信息进行多层面的处理,获得对事物的全面理解,这是单视角方法无法比拟的。由
随着数字图像的快速和大规模增长,人们找到感兴趣的图像越发困难,这促使人们研究和开发有效的图像存储,索引和检索技术。图像检索和索引已被应用于许多领域,例如互联网、广告、艺术、建筑、教育、医疗、生物和其他许多行业。基于文本的图像检索首先以文本形式手工标记图像,然后使用关键字来检索图像。这种基于字符匹配程度的图像检索方法既主观又费时。基于内容的图像检索方法克服了基于文本方法的缺点,依据图像的视觉特征(颜
随着计算机科学技术的飞速发展,肿瘤放疗进入到了一个精准治疗的时代。图像引导放疗可以在提高放射剂量杀死肿瘤组织的同时,有效保护肿瘤周围的正常组织,极大提高了患者的生存率和生存质量。放疗中,肿瘤专家和放疗物理师需要对肿瘤靶区和临近风险器官进行精确勾画,从而可利用计划系统进行放射治疗仿真,获得患者在理想状态下的受剂量。利用计算机作为工具,并结合有效的医学图像分割算法,实现肿瘤和风险器官的高效、自动化分割
近二十年来,不确定多智能系统的一致性控制问题已经成为控制科学研究领域的一个热点问题,尤其是基于逼近器的分布式控制受到了学者们的广泛关注,获得了大量理论研究结果,但是仍然有一些公开的问题值得进一步的研究和讨论.本文将针对已有工作中广泛存在的全局一致性控制问题进行研究.研究思想来源于单个系统全局稳定性,万能逼近器作为一个前馈补偿器来描述不确定非线性动态,依靠领导者信号作为输入信号来逼近不确定非线性动态