社交问答网站答案质量评价研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:liyibo6941
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0时代背景下,随着社交网站及自媒体的迅速发展,以知乎、quora为代表的社交问答网站逐步取代了传统的搜索式问答网站。与百度知道、新浪爱问这些基于捜索引擎的问答网站相比,社交问答网站大多不依靠权威机构或专家提供信息,而是采用UGC(用户生产内容)的方式,以“社交关系”和“问答机制”为基本特征。社交问答网站中的每个用户都同时扮演着信息接收者、信息提供者和信息传播者的三重角色。因为社交问答网站鼓励人人参与内容创作与分享的特点,网站内容的质量不可避免的会受到影响,为了帮助网站选取高质量内容进行推送,保证网站中高质量内容得到应有的传播,同时对低质量内容进行限制和改进,对答案质量的评价是必不可少的。本文主要针对社交问答网站中答案的质量评价方法进行研究,以信息采纳模型作为理论基础,在对国内外社交问答网站相关研究进行梳理后,对知乎网站实际数据进行分析,选择答案表层属性、答案文本属性、答题者影响力属性、答题者专业性属性四个方面的特征作为初始的评价指标。利用网络爬虫抓取了知乎网上具有代表性的9484条“问题-答案-答题者”信息,通过数理统计、机器学习、基于情感词典的文本情感值计算等方法提取了答案质量评价的相关特征,运用特征工程相关方法对特征进行筛选,得到包括文本长度、平均句长等共13个特征的指标体系。通过对几种机器学习分类算法实验结果的对比,选择了效果最佳的随机森林算法进行模型构建,最终模型在测试集上的实验结果显示模型的分类准确率达到79.6%。通过在模型中逐步代入特征集和分析模型中各特征的重要性权重验证了答题者特征对于答案质量评价的作用。本研究的创新点在于在现有的答案质量评价体系基础上加入了答题者相关特征,同时考虑答案表层特征、文本特征和答题者特征的影响,并利用网站的真实数据,建立了社交问答网站答案质量评价模型,通过在模型中逐步代入特征集验证了答题者特征对于答案质量评价的作用,丰富了问答网站答案质量的研究思路,同时为社交问答网站管理者提高网站内容质量提供了参考。
其他文献
在习近平新时代中国特色社会主义思想的引领下,十九大提出了到2020年全面建成小康社会,目前正在进行以人民为中心下的精准扶贫脱贫攻坚战和乡村振兴。河源市是山区,“三农”问题对经济社会发展的制约作用日益凸现,脱贫攻坚时间紧、任务重,必须真抓实干、埋头苦干,需要大量的资金确保本地区如期脱贫。因此,以河源农村社会、经济、环境、人文建设等为切入点,从河源财政支农资金的管理运作以及经济可持续发展的角度出发研究
随着信息技术的发展和大数据的兴起,互联网成为了人们发布和获取信息的重要来源。其中,用户产生的大部分信息以文本的形式积累在网络中。如何从这些大规模非结构化文本中,挖
网络流量测量是指对网络中的流量信息进行统计,进而为流量规划、入侵检测以及网络异常检测等网络管理应用提供输入信息。传统网络架构存在许多缺陷,例如缺乏灵活的控制能力和基本的网络测量功能,从而导致测量任务实施复杂,支持的测量粒度粗,测量准确性低等问题。而在可编程网络中,由于交换机具有可编程性,因此可以在交换机上灵活地部署定制的网络流量测量功能,为细粒度的网络流量测量奠定了基础。本文主要对可编程网络中的流
物联网是新一轮科技革命的核心驱动,是引领社会发展的重要力量。射频识别是一种典型的反向散射通信技术,它通过从射频信号中收集能量来使得通信设备摆脱固定电池的束缚,一定程度上解决了物联网中传感器的能源问题。然而,现有射频识别系统需要读写器发送专用的射频激励信号来激活标签,系统的通信距离和部署灵活性受限,无法满足未来物联网通信的需求。环境反向散射通信(Ambient Backscatter Communi
互联网非公开股权融资是在互联网的快速发展和普惠金融背景下产生,作为一种新兴的融资模式,它为经济发展注入新的血液,激发各创新群体的活力与积极性,进一步营造“大众创业、
现实世界中的许多复杂系统都可以抽象地表现为网络形态,随着大型网络数据可用性的提高,以及学者们对复杂网络定量、定性特征研究的深入,大型复杂网络的研究已变成一门极具意义的课题,而找寻复杂网络数据中的社群结构正是其中被着重研究的难点之一。2017年,一种围绕找到社团中心点继而吸引拉拢周围其他点的类天体万有引力的基于种子点选取的重叠社区发现算法(CNS)被提出,随后,在2019年被提出的一种融入了其他天体
近年来深度学习技术在各行各已经起着越来越重要的作用,但是深度学习算法能够取得良好性能的关键是建立在需要消耗大量的资源对深度学习模型进行训练的基础上的,这个过程不仅
狂犬病(rabies)是由狂犬病病毒(rabies virus,RABV)引起的具有高度神经嗜性的烈性人兽共患传染病,致死率达100%,已成为一个重大的公共卫生问题。该病目前无特效疗法,而通过暴露前
复杂网络可以自然的表示许多复杂问题,因此复杂网络可以用来解决现实世界中存在的许多问题。在许多不同的领域中,复杂网络的表示是不一样的,如在社会领域有社会关系网络,在生物学领域有基因调控网络、蛋白质相互作用网络等。在这里,复杂网络通常具有可辩别的社区结构。社区结构可以被看作一种“网络簇”。在复杂网络中,属于同一个社区的节点彼此之间密切相连,社区内存在大量的内部边,而来自不同社区的节点相互之间连接稀疏,
猪伪狂犬病(Pseudorabies,PR),又名奥耶斯基氏病(Aujezsky’s disease),是由猪伪狂犬病毒(Pseudorabies virus,PRV)引发的一种急性病毒性传染病,猪作为PR的自然宿主,同时也是非常重