标签评分算法及实现

被引量 : 0次 | 上传用户:yxdtlwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
标签(TAG)是WEB 2.0的一个重要的组成成分,许多著名的内容分享网站如Flickr,Delicious等均允许用户在提交内容的同时附加一些词汇(TAG)做补充,这些标签包含用户对内容的理解,是非常重要的语意素材,可以用来做检索内容,内容推荐,标签推荐,兴趣小组发现等应用研究。但是许多网站现有的标签排序都比较简单的,有些是无序的,有些只是用简单的标签使用次数,因此人们需要一种更好排序算法来对标签进行排序。本文在分析标签使用行为的基础上,结合标签系统的用户、标签、内容三个要素,综合利用图算法和数据挖掘算法来对标签进行评分。本文针对文档类或非文档类标签分享网站分别提出了三种为标签进行排序的方法。第一种方法是基于兴趣传播模型的方法,通过构建“用户-标签-文档”图并使用Manifold Ranking算法来评分。第二种方法是根据用户和标签之间的相互加强关系使用新的EigenTag算法来评分。第三种方法是基于随机跳转模型的评分方法。我们构建了一张标签关系图并利用随机跳转模型来对标签进行排序。我们将人工标记的标签排序作为标准的排序,并使用NDCG标准来衡量算法的准确性。实验证明,相对于网站原始的排序,本文提出的各方法在标签排序准确性上有很大的提高。
其他文献
本文介绍了基于DSP的驾驶员疲劳瞌睡检测系统,详细介绍了以SAA7115为视频采集A/D、DSP TMS320DM642为核心处理器、SAA7105为视频输出D/A,并以FPGA控制输出来实现增强显示功能
以科技创新是发展绿色经济、提升绿色转型能力的第一推动力这一观点为核心,在评价中国主要的30个省、自治区和直辖市的绿色转型能力之基础上,针对中国区域绿色转型能力存在的
用正己烷溶解达川和万县产的两种红橘油, 将样品皂化和甲酯化后, 以毛细管柱 DB-WAX作为分离柱, 用气相色谱 -质谱法测定其中的脂肪酸组成, 两种红橘油的主要脂肪酸成分有明
当前,女性企业家正成为创业群体中的重要力量,但其创业原因却由寻求经济条件改善等外部动因逐渐转化为寻求自我价值实现的内部动因。通过对当前女性企业家创业的内部动因特点
<正>2014年12月13日,习近平总书记在江苏调研时,首次挺出要"协调推进全面建成小康社会、全面深化改革、全面推进依法治国、全面从严治党,推动改革开放和社会主义现代化建设迈
独立制片生产投入小,宣传发行难,创作和宣发方式自由,对市场的反应很敏锐。中国的独立制片在政策上拥有了一定的发展空间,但还只是刚刚起步,远没有形成旺盛的生长态势,作为一
太阳能可以说是取之不尽、用之不竭而且又没有污染的清洁能源。在人口不断增加,煤与石油等矿物能源逐渐枯竭,环境污染日益严重的今天,太阳能的应用显得愈来愈重要,成为全世界
本文从文学审美意象入手,对苏童近作《河岸》中意象的隐喻性进行深度解析,分别从河与岸、父与子、烈士与石碑三组意象中探讨其文化和哲学内涵,肯定其新历史小说的审美价值。
作为清代江南一大望族的延令季氏家族,不但在文学、学术、艺术诸领域作出较大贡献,而且爵位蝉联,历经数代,百余年风流不衰,在社会上颇有声望,是清代延令影响最大、最具代表性
开发小型化高效化的车用发动机一直是各主要汽车厂商的主要的研究方向。高效化的车用发动机一般具备高功率、大扭矩和超低油耗及具备竞争力的NVH性能。现代意义上的车用发动