基于用户圈和内容联动关系的UGC内容质量评估

来源 :北京邮电大学 | 被引量 : 9次 | 上传用户:zdnumber
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网和社交网络的大规模普及,越来越多的用户每天会产生数以亿计的用户产生内容(UGC)。然而,由于用户发表内容的门槛的降低,任何用户在任何时间都可以发表自己的想法,因此,也导致了用户产生内容的质量参差不齐。但是用户产生内容无论在商业价值的挖掘还是在政府对舆论的监督等方面都有着重要的作用,因此,在大规模的UGC数据中寻找高质量的内容就成为了一个重要的研究课题。在本文中,我们提出了一种新的UGC质量的评估方法,该方法使用了在社交网络中的用户圈结构,也就是一些兴趣爱好相似的人组成的一种社区结构。从直观来看,内容吸引用户圈的数量比吸引用户的数量更加能够表现其内容的质量。因为这说明该内容覆盖的用户层面更广,更具有潜力成为热点内容。因此,本文提出了基于用户圈和内容联动关系的UGC内容质量评估算法,简称UCCC算法。UCCC算法基于用户圈网络图,内容网络图和用户圈-内容网络图进行计算。其计算原理是基于用户圈-内容质量的互增强原理。即与内容相关的用户圈质量越高,内容质量越高;而内容的质量越高,也证明与其相关的用户圈的质量也越高。本文基于真实的数据进行了UGC质量评估实验,实验结果表明UCCC算法在大部分实验数据上的评估效果要优于其他的算法,同时也证明了用户圈维度特征相比用户维度在UGC质量评估中更加有效。本论文研究得到国家自然科学基金项目“基于hLDA层次主题模型的中文多文档摘要研究”(项目批准号:61202247)和“面向不确定性的Web2.0用户创作内容管理研究”(项目批准号:71231002)的资助。
其他文献
运动边界非定常问题一直是航空航天领域研究的热点和难点。能够快速、准确的计算和预测单个物体或者多体部件之间的运动轨迹、气动干扰以获得非定常特性是研究此类问题的关键
共享软件的概念出现于上世纪八十年代,共享软件是以“先使用后付费”的方式销售的享有版权的软件。共享软件在未注册之前通常会有一定的功能限制,如使用时间限制、次数限制、功
本文基于高速PCB板EDA设计流程,结合Intel芯片组-Broadwater的台式计算机主板设计,分别在主板的布局、电源平面设计和高速信号布线方面进行了分析和优化设计。在布局方案方面,分
随着在线交易越来越普遍,Internet涌现出大量的电子商务服务。然而,传统的基于EDI技术的电子商务存在重大的缺陷。由于实施EDI的企业,双方首先必须达成商业协议,然后依据这种协议
数字水印技术是解决数字作品版权保护问题的一个有力的武器,然而,目前与其相关的大部分研究都集中在对数字水印的嵌入和检测算法上,属于图像处理领域问题,主要目的在于保护版
多媒体技术和网络技术近年来得到迅猛发展。随之而来的数字媒体的信息安全、知识产权保护和认证等问题也变得日益突出,这已成为数字世界中的一个非常紧迫的重要议题。数字水
计算对称矩阵中的某些特定的特征值和特征向量问题是很多科学计算领域中都存在的重要课题(如电子结构计算领域)。在很多领域,特征值问题的计算在总计算时间中占据很大的比重,对于
众所周知,软件不可避免地持续演化已经是不争的事实。而演化的挑战不仅是演化什么和如何演化,还包括软件生命周期中相关工作制品的同步演化,也就是软件演化的维护和管理。面向特
信息化技术已经逐步深入到政府管理工作中的各个环节,以信息化技术为基础的电子政务2,已经成为政府提高管理水平和办事效率、促进政务公开和廉正建设的重要手段。 传统的面
本论文以实现规划数据的共享为目标,研究如何建立一个基于WebGIS规划管理信息发布系统,这样的平台能把规划信息以电子地图的形式发布在互联网上,不仅能及时的了解全市规划资源的