基于层级标签的社会标注模型研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:skyedge228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,Web2.0平台上一个重要部件——社会标注系统或协同标注系统作为一种有效的工具为互联网用户提供信息组织和检索的功能。例如Delicious.com、 Bibsonomy.org分别允许用户使用标签标注自己感兴趣的Web页和科研文献。学界和IT业界对社会标注系统已有了较为广泛的讨论。但是,由于所标注的数据资源的海量性和分散性,现有的社会标注系统在发挥其优势的同时,也带来了一个难以解决的困难问题,即如何应对系统伴随数据规模的扩大而来的功能和效率性的不足和下降。此问题的根本原因在于目前的各类注系统主要采用基于扁平标签的社会标注模型,该模型特点是无结构的离散标注,并产生扁平无结构的标签集。面对这一问题,本文提出一种基于层级标签的社会标注模型,即鼓励用户在标注动作即时就以层级标签形式表达和保存标签之间的简单语义关系。论文对这一基于层级标签的社会标注模型的可行性和有效性开展了研究。论文分理论研究和应用研究两个部分。理论研究部分探讨了如何把用户个体层面的层级标签聚合成集体层面的分众分类的可行性,并验证所生成的分众分类在语义结构的清晰性及在信息导航上的可用性。应用研究部分在理论研究基础上设计了一个基于层级标签的渐进式分众分类生成方法,并开发了相应的原型系统。论文的要点和创新点归纳如下:第一,提出基于层级标签的标注模型。基于该模型的标注系统在支持用户表达和保存简单的语义关系同时,并可改善扁平标签结构混乱和语义不一致等问题。第二,综合采用基于实际数据的分析和基于Agent仿真的方法,通过评估分众分类导航性能的思路,验证了层级标签可在社会标注系统中的搜索导航支持方面发挥积极效果。第三,面向实际应用,初步给出了应对层级标签在实际应用中可能遇到若干问题的解决方法;最后设计了一个采用上述标注模型的社会标注原型系统。
其他文献
工程项目的工期-成本-质量多目标优化问题,是典型的NP-hard难题:在一定的约束条件下,通过某种方法处理目标间的冲突、求出问题的最优解,以确定最优的方案组合、实现三大目标的整
传统的口碑传播存在着地理限制、传播范围有限等局限性。借助于日益发展的信息技术和互联网技术,网络用户可以突破地缘限制,随时随地和其他用户进行沟通,口碑的传播范围得到极大
多维数据可视化是将多维数据展现在低维空间中,使得用户更容易发现隐藏在数据中的某些特征,对于数据分析和知识发现具有重要意义。为了保证可视化结果的可靠性,需要在降维过程中
从双氨基甲基手性双环胍出发,经三步反应合成了由稳定的共价键桥联双环胍、氮杂冠醚和萘环的氨基酸受体1.液-液竞争萃取和~1H NMR实验表明受体对氨基酸两性离子具有较好的侧
在新闻摄影中,拍摄者一定要抓取新闻事件的典型瞬间,才能使新闻照片有较强的吸引力。所谓新闻事件的典型瞬间,是指在新闻事件进行过程中出现的高潮以及突然出现的生动情节。
<正> 1948年4月,中共浙东临委和四明工委在浙江东部的四明山区创办过一张地下小报——《四明简讯》。《四明简讯》是在解放战争进入战略反攻的形势下创办的。自1947年秋、冬以来,东北、华北、西北及中原战场的主动权已完全掌握在我们手中,正如毛主席在《目前的形势和我们的任务》中指出的:“人民解放军即已转入了全国规模的
在技术快速发展和大数据的时代背景下,技术集群已成为技术发展优势的重要模式,科学技术决策受技术集群分析的影响,能否在未来占据有利的竞争地位也由它所决定。专利文献包括了世界范围内九成以上的技术情报,与一般的技术类期刊信息相比提前五年左右。鉴于此,本文从知识学习的角度出发,以R-studio和LogletLab2软件为工具,提出了技术集群研究的新思路:主要为技术集群的分类及发展趋势预测。本研究在分析了专
试验目的是应用~(15)N 弄清温州蜜柑在春季新生器官形成时,作为树体内贮存氮素的秋肥的作用。以栽在内径为76厘米的混凝土盆内的两棵十一年生结果树为试材。试验前一年的施
人们认为玉米高粱是最难贮藏保管的种子,这是有一定道理的,但是只要我们掌握它们的特性就可以做到安全贮藏。玉米种子较难贮藏有两个原因:第一,玉米的胚部所占比例较其它种
利用杂种优势是提高棉花产量的有效途径。亲本选配的好坏将直接影响优势的大小。为了找出一些优势指标,用来早期预测优势,以帮助正确选配亲本,两年来分别从遗传、生理、生化