基于多模型的问答社区答案质量评价研究

来源 :南京师范大学 | 被引量 : 1次 | 上传用户:warewell
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的快速发展为人们获取、共享知识提供了新的工具。具有代表性的问答社区在人们学习、生活、工作、娱乐等各个方面扮演着重要的角色,随着其信息量的指数级增长,如何有效的评价问答社区内的答案质量便成为了一项重要的工作。本文为了评价问答社区中用户生成的答案质量,提出了基于多种模型,深度挖掘问答社区内可用作答案质量评价的语义特征和非语义特征,通过机器学习分类方法实现了对答案质量的评价。主要包含以下内容:(1)基于主题相关性的答案质量评价针对问答社区的问题和答案文本具有的文本特征矩阵稀疏,上下文信息丢失,以及问题文本的长度和答案文本的长度严重不匹配这一问题和现状,本文提出了基于问题文本语义扩展的答案质量评价模型。首先,根据使用问题和正确答案构成的文本集,通过Word2Vec训练词向量,在词粒度上挖掘文本语义信息,对问题文本的主干词计算与其相关的词集,从而实现了对问题文本的语义扩展。其次,使用LDA主题挖掘模型,通过对问题和答案文本的主题推断,将文本表示成为主题向量,并使用JS距离计算了问题和答案文本的主题相关性。最后以问题和答案的主题相关性为特征,采用机器学习常用算法SVM、LR和决策树C4.5学习构建了答案质量评价分类器。在此基础上进行实验,发现本文所提出的基于语义扩展的方法计算得到的主题相关性对答案质量的分类效果上明显高于基于LDA的主题相关性计算的方法,但是对答案分类的精确率低于现有研究间接评价方法。(2)融合多特征的答案质量评价本文融合了文本特征、用户特征、社会交互特征和时序特征,对问答社区内数据深入挖掘,提出使用层次分析法计算用户权威度,通过朴素贝叶斯算法挖掘了答案文本的情感极性,同时计算抽取了答案及时性、答案丰富程度和答案得票数并结合上文计算得到的问题答案主题相关性训练答案质量的分类模型,实现SVM、LR和决策树C4.5答案质量分类器。通过实验发现本文模型对答案质量的分类效果明显高于仅基于问题答案主题相关性的分类方法。
其他文献
目的:评价不同FISH技术对inv(16)AML的诊断价值。 方法:采用4种探针(MYH11单色探针、MYH11双色探针、16号染色体长臂涂抹探针和22号染色体着丝粒探针)和3种FISH技术(单色FISH、双
<正>《中国国门时报》报道日前,北京口岸首都国际机场迎来了首例精神病人服务犬入境,检疫值班人员本着"以人为本"的工作原则,按照检验检疫法规,仔细核对
在此,我意图讨论两个不常结合在一起的论题。一个是关于乐谱多重诠释的可能性;另一个是与音乐创造和表演有关的顿悟或广阔无际(epiphanic or oceanic)的体验。这里所说的诠释
目前我国法学教育不论是课程的设置还是教学方法,都还停留在传统理论型研究人才的培养模式上,难以造就现代社会所需要的人才。重新界定培养目标,探索新时期法律人才培养模式
区位问题是高中人文地理的核心内容,是中学地理的主干知识,主要包括农业区位、工业区位、城市区位、交通区位、商业区位等。从近几年的高考试题来看,不管是文综卷还是地理单科卷
鸡腿菇又名毛头鬼伞,因形似鸡腿、味如鸡丝而得名。鸡腿菇是一种栽培原料广、成本低、生产周期短、效益高的菇种,不仅适合规模化、专业化生产,而且又能实现周年生产,还能和农
目的:探讨肋间神经阻滞联合术后氟比洛芬酯对行单操作孔手术的肺癌患者术后早期镇痛效果、早期术后康复的影响。方法:回顾性分析我院95例接受单操作孔手术的肺癌患者的临床资料,按术中行肋间神经阻滞与否,分为术中肋间神经阻滞+术后静注氟比洛芬酯组(B组)与单独术后使用氟比洛芬酯组(F组)。手术结束前,B组患者行胸腔镜探查时,将10ml 0.75%罗哌卡因注射液沿肋间注入两个切口前后缘行肋间神经阻滞。两组患者
随着社会的发展和人们对城市景观的需求变化,我国公园绿地的发展形式日益丰富,而互动景观作为强调场所趣味性和参与性的景观形式,越来越受到公众的欢迎,是未来景观的发展方向,在城市景观中发挥着重要的作用。为了提高湿地公园的趣味性与游戏体验,满足人们的多样化需求,更合理地建设开发和保护湿地,本文试图以互动景观为出发点,在充分分析前人对城市湿地公园规划设计研究的基础上,采用资料收集、理论研究、案例分析与社会调
本文介绍了近年来玉米遗传转化系统的建立、基因导入手段、方法等方面的研究进展。
目的探讨结肠癌导致急性肠梗阻患者行一期手术切除治疗的价值。方法纳入贵港市人民医院2017年6月—2018年6月接收的结肠癌导致急性肠梗阻患者90例作为研究对象,以随机数字表