在线问答社区推荐算法研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:uuu_uuu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答社区已经逐渐发展成为人们分享并获取知识和信息的平台,每天都有大量的新问题被用户提出来,等待其余用户回答和讨论。但是随着社区的发展积累了海量的问题、答案及用户数据,问答社区开始面临“信息过载问题”。一方面是用户难以快速找到自己感兴趣的相关问题,另一方面是很多新问题被堙没在海量的数据里,无法及时获得高质量的答案,同时新问题缺少能够准确描述问题信息的话题标签,导致很难被其余用户检索发现。本文针对问答社区面临的数据挑战难题,研究并设计解决标签推荐和专家用户推荐的算法模型。论文的研究工作主要分为两个部分。第一部分提出了基于深度学习的标签推荐算法。根据问题的多标签属性,首先将标签推荐定义为一个多标签文本分类问题,然后结合双向长短期记忆网络和卷积神经网络提取问题文本的语义特征信息,并在训练数据集上进行有监督的多标签分类训练。为了提升算法模型的性能,本文在双向长短期记忆网络中引入了基于传统注意力机制的单词注意力机制和句子注意力机制。论文的第二个研究工作是针对问答社区新问题的专家用户推荐,本文将专家用户推荐定义为一个对级排序学习问题,即对于每一个问题,按照答案的质量优劣,构造每两个回答者之间的相对偏序关系作为训练样本进行模型学习。为了缓解用户行为稀疏性以及为了增强用户和问题的匹配质量,算法构造一个基于用户回答问题的行为和用户社区关注关系的异构图,通过在异构图中进行随机游走发现更多的用户-问题潜在关系。在进行排序学习训练时,需要以数学形式表示问题和用户并计算问题和用户的相关性,本文使用双向长短期记忆网络进行问题文本的表示学习,同时学习一个用户嵌入矩阵表示用户。为了增强神经网络的表示学习能力,针对问答社区问题的多话题属性特点,提出一个多话题注意力机制。本文在知乎的真实问答数据集上验证了提出的两个算法模型的性能,实验结果表明本文提出的算法模型优于传统的标签推荐和专家用户推荐算法,其中标签推荐算法的F1-Score指标相较于传统的基于内容的方法提升了30%,比基于单个深度学习模型的算法提升了10%。专家用户推荐算法在NDCG和MRR这两个指标上比传统算法提升了10%左右,在F1-Score指标上提升超过了3%。
其他文献
大气湍流的存在对于毫米波传播有着重要影响。运用Bulk方法和Monin-Obukhov相似性理论,采用Frederickson和Thiermann两种相似性函数对近地面大气毫米波段的折射率结构常数进
随着当代社会的发展,文明的进步,思想政治教育工作尤其是新时期大学生思想政治教育工作成为社会工作的重中之重。文章针对新时期大学生的思想、时代特点,对大学生思想政治教
在全社会共同努力,推进自主创新的新形势下,基础科学研究在高校科技创新中的地位和作用日趋显著。本文立足我国高校基础研究的现状,探讨了目前高校基础研究发展中存在的问题
近年来,城镇化一直是专家学者讨论的热点,也是国家和政府的工作重心。世界范围内城镇化发展的经验表明,城镇化的发展与产业发展密不可分,尤其是与第三产业互动关系明显,我国
目的:探讨分析手术配合与护理在腹腔镜下子宫颈癌根治术中的应用效果。方法:回顾性分析40例腹腔镜下子宫颈癌根治术患者临床资料,患者均给予手术配合与护理,观察分析手术配合
<正>1、引言龙门山构造带位于青藏高原东缘,也是南北地震带的中南段,龙门山构造带及邻区深部地球物理探测结果表明:(1)青藏高原东缘松潘地块和川滇地块中下地壳存在广泛的塑
会议
目的:探讨稳心颗粒联合胺碘酮治疗冠心病(CAD)心律失常的疗效和用药安全性。方法:运用系统评价的方法,全面检索近两年来来自万方数据库的相关文献以及所获文献的参考文献。初
研究2种不同管路布置方法对风机叶片灌注时间以及灌注效果的影响,并对灌注过程中孔隙的形成进行了分析。实验表明,采用先开启叶片壳体主管道,再开启叶根铺层上方管路的方法,
<正> 粗粒土是粗颗粒土石混合料的总称,它的成因多种多样,粒径相差悬殊(有石、砾、砂、土粒),工程性能甚为复杂。但有一个共同的特点,都是由大小不等,性质不一的颗粒彼此充填
自诞生人类生命以来,教育便如影随形。尽管在生命和教育的概念都还未形成时,人们为了生存下去,本能的将自己在生存中获得的一些经验、技能等通过言传身教的方式传递给下一代