社区问答系统最佳回答机制的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:COMMA87730030
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区问答系统目前已成为一项新兴的Web 2.0服务。不同于传统的自动问答系统,人们在这类系统中提出自己的问题后,其他的用户可以根据自身经验来回答相应的问题。在经过一段时间后,提问者可以在所有别的用户提供的答案中选择一个答案作为最佳答案,或者由大众投票来选取最佳答案。然而,由于该过程完全是通过人工操作,没有机器的自动评判,使得在这类系统中存在回答质量参差不齐,提问者随意选择最佳答案的现象。这不仅导致了社区问答系统本身质量的下降,也给其他系统对其进行重用如搜索系统利用社区问答系统中的<问题,回答>对来作为精确知识库带来困难。因此,我们提出了针对社区问答系统中最佳回答机制的研究课题。目前的社区问答系统中的一个机制是一个问题只能有一个最佳回答。而通过我们的观察发现,并不是所有的问题都只有一个最佳回答,有许多问题都可能有很多备选的回答。因此,对于这个问题,我们提出了采用回答摘要技术的方法,通过对问题的所有回答进行摘要来生成最佳回答的备选,这使得问题能够有一个具有全面回答的摘要,不仅弥补了现行系统的不足,也对别的系统对社区问答系统上庞大知识库的重用做了很大的贡献。具体来讲,本文首先对于社区问答系统上的问题和答案进行了深入的研究。我们通过对答案中最佳答案是否可重用标准的分类以及对问题意图的分类后发现,超过78%的问题的最佳答案是在被询问到相似问题时可以重用的,而这其中不超过48%的问题只有一个最佳答案。开放型问题和意见型问题中有多个最佳答案的问题所占的比例最大。接着,本文对于开放型问题和意见型问题这两类在目前的最佳回答机制下对于问题/答案对的重用存在很大改进余地的问题提出了有针对性的回答摘要算法。对于开放型问题,本文提出了回答聚类算法和聚类标签算法;对于意见型问题中的情感型问题,本文提出了情感极性判断算法;对于意见型问题中的列表型问题,本文提出了句子聚类算法。本文同时提出了信息内容和可读性两个标准。并在实验中表明本文所提出的针对问题类型的摘要算法对于原始的最佳回答有着很大的提高。
其他文献
网络技术的迅速发展,给人们的生活及生产带来了巨大转变,它在丰富人们精神生活的同时,也给人们的工作带来便捷。但是,计算机网络是一柄双刃剑,它具有联结形式多样性、终端分
数字视频属于国家重点发展的信息产业领域,宽带网络和数字电视的迅速发展,使得视频点播、交互电视、视频网站等应用都将面临大量涌现的数字化视频数据,对视频摘要技术的研究
骨肿瘤是发生于骨骼或其附属组织(血管、神经、骨髓等)的肿瘤,是一种常见病。骨肿瘤有良性,恶性之分。良性骨肿瘤易根治,预后良好。恶性骨肿瘤发展迅速,预后不佳,死亡率高。
SaaS软件服务模式通过将离散的软件买断模式转化为集中的软件租用模式,使用者可以根据自己的业务特点和需要灵活的定制数据库的相关功能。同时中间件的发展为SaaS模式提供了
随着互联网的飞速发展,网页数量呈指数增长。面对互联网上的海量信息,如何快速、准确地从海量信息中找到自己需要的信息成为当前亟待解决的问题。网页分类作为信息组织和处理的
互联网按“深度”可以分为Deep Web和Surface Web。与通过超链接访问的Surface Web不同,Deep Web中的信息只能通过向表单提交查询来获得。Surface Web上的信息多为非结构化信
作为一种关注域间流量级别上的网络性能优化技术,域间流量工程越来越受到ISP的重视。BGP协议是目前唯一广泛使用的域间路由协议,用来引导域间流量穿越自治域。因此BGP路由的
人脸识别是一种重要的生物特征识别技术,在公共安全、信息安全、金融等领域具有广阔的应用前景。近二十年来,人脸识别取得了很大进展,也涌现出了一些有效的人脸识别算法。其中,基
随着计算机技术的发展,互联网越来越深入人们的日常生活。但是在它给人们带来便利的同时,网络安全问题也随之而来。木马便是其中一种威胁越来越大的基于互联网的恶意软件。为
显著性检测是图像处理与计算机视觉领域的重要研究内容之一。本文将人眼对RGB三原色的敏感度差异引入显著性检测方法中,探讨改进的基于RGB视觉敏感度的显著性检测方法。本文