社区问答系统中的社团发现技术研究及其应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yjg020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区问答系统(Community-based Question and Answering System, CQA)通过聚集大众智慧,能够免费提供问题的个性化解决方案,例如Yahoo! Answer,百度知道等。然而CQA系统无显式的社团结构,因此“社团”性质没能得到充分应用;而且CQA系统具有较高的开放性:知识内容共享和搜索引擎可接触,使得CQA系统易受到虚假账户的入侵,导致CQA账户行为规律复杂,知识质量急剧下降。为解决CQA系统的上述问题,有必要深入研究系统中账户行为规律和网络性质。同时这些研究工作也有助于解决如下问题,例如相关用户推荐,相似问答内容融合,新型话题发现,虚假用户识别,个性化问答服务等,这些都能提高CQA系统中的知识质量。本文以中国最大的CQA系统“百度知道”为代表,分析CQA系统中账户的行为规律。通过探索账户间的问答关系,本文构建两种网络模型,展示了CQA系统的基本网络性质。为检测CQA系统中的以兴趣为中心的账户社团,基于标签传播算法SLPA,我们提出一个面向CQA系统的社团发现算法MSLPA (Multilayer speaker-listener label propagation algorithm)。本文从网络规模、社团主题、聚合效果、层次结构等多方面评估MSLPA算法的性能,和已有的几种社团发现算法相比,MSLPA能够发现大规模CQA网络中有意义的、重叠的、具有层次结构的账户社团,避免生成大量的微型社团,有效聚合关联账户。基于MSLPA社团发现技术,本文提出一个CQA系统中鉴别虚假账户的方法。首先给出一组具有较高区分度的账户属性集合,包括具有一定物理含义的账户个体属性和账户所属的社团性质,其中个体属性由统计分析得到,社团性质由本文的社团发现结果得到。本文将新提出的属性集合应用于简洁的J48决策树分类器上,判断账户为正常账户或者虚假账户。实验结果显示,该方法表现出良好的性能和效果,分类准确率得到较大的提高。
其他文献
当今大型软件系统的开发活动不可避免的深深植根于宽广的问题上下文(Problem Context)当中,涉及到各种各样的利益相关人员(System Stakeholder),这些人会从自身的视角(Viewpo
在日常的生活和工作中,越来越多的人采用图片来记录生活和工作的点点点滴滴。图片的应用已经显得越来越重要。现在虽然有很多对图像进行加密的算法,但是各种算法仍然存在一定
云计算是一种实现大规模计算的信息处理方式,本质上是利用虚拟化技术、分布式计算技术和网络技术将分散的云基础单元(简称云元)汇聚到一起形成共享资源池,并以按需、弹性和可度量
路径规划技术是目前众多应用技术领域的研究热点,具有重要的科研价值和广阔的应用前景。路径规划技术的核心内容就是规划算法。目前求解路径规划问题的方法主要有A*算法、粒子
随着互联网的普及、软件应用技术和模式的快速发展,软件已呈网络化、平台化和服务化的发展趋势。其中,软件即服务(SaaS)是一种新型的软件服务模式,凭借其按需租用、不需维护
安全关键系统是指系统的失效会造成严重的后果的系统,此类系统在日常生活中随处可见,如配电系统、灾难应对调度系统、人工心肺机和航空交通管制系统等。时序行为作为安全关键系
当前,世界范围内中风已经与冠心病、癌症一起被列为威胁人类健康的三大疾病之一,国内患中风的人数逐年提升。受家庭经济承担能力的限制,大多数中风病人在医院进行初步的康复
大型旋转机械设备中,齿轮箱作为传递动力、改变转速的重要零部件,有着不可替代的作用。齿轮箱一般由多对啮合在一起的齿轮、转轴、轴承、固定基座、箱体等部件构成,这就决定了其结构复杂、装配精度要求高、加工工艺复杂的特点。因此,在复杂、恶劣的工况环境下,齿轮箱易出现故障并影响整个生产线甚至带来大量经济损失,据统计,旋转机械故障中齿轮故障占80%,因此对齿轮箱的运行过程进行状态监测和故障诊断具有极其重要的意义
随着社会对公共安全要求的不断提高,智能视频监控系统因其直观性、智能性和主动性得到了广泛关注,具有重要的研究价值和广阔的应用前景。多目标跟踪作为智能视频监控技术的核心
随着电子电路领域的飞速发展,计算机的计算能力得到了大幅提升,深度学习神经网络再次迎来了飞速发展的浪潮。全连接神经网络能够处理大规模的数据,提取全部的数据特征,实现大规模