D2核K-means算法在标签系统中的应用研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:nicolas6520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网用户的个性化需求和社区化生活方式的推广,Web2.0下的社会化标签系统迅速发展。为了更好的利用社会化标签系统,学者从不同的方面给予研究:标签标注模型、标签的可视化研究、标签的应用以及社会化标签系统中的局限性。本文主要研究社会化标签应用中个性化推荐的核心基础即用户兴趣社区构建,具体工作主要包括以下几方面:1本文首先阐述构建用户兴趣社区的研究现状,介绍所涉及的聚类技术,社会化标签系统,用户兴趣社区的定义,研究了在社会化标签中构建用户兴趣社区的谱聚类,层次聚类以及K-means算法等方法。2介绍K-means算法使用的目标函数改变定理,正态分布,D2思想等相关知识,研究了核K-means算法及其关特性,重点分析该算法的不足,提出了一种基于D2权重的核K-means聚类算法,在公共数据集UCI上对新旧算法进行验证,证明改进的算法具有更好的聚类效果。3分析K-means算法在构建用户兴趣社区中的不足,提出基于语义和时间的聚类框架,使用改进的D2权重核K-means算法与K-means算法对用户聚类进行对比实验,证明改进的D2权重核K-means算法能够更好地识别用户兴趣社区。
其他文献
统一建模语言(Unified Modeling Language, UML)是一种通用的图形建模语言,它已成为面向对象分析和设计的工业标准。UML采用元模型、对象约束语言(Object Constraint Languag
随着无线传感器网络技术的快速发展和日益成熟,无线技术走入了工业控制系统领域,并成为了工业控制系统研究的热点;工业无线技术拥有低成本、低功耗、部署简单等众多优点,拥有
绝大部分的蛋白质相互作用结合自由能仅由少数关键残基所贡献,这种残基被称为热点残基。热点残基对我们理解蛋白质功能和研究蛋白质相互作用非常重要。目前主要通过丙氨酸突变
计算机三维动画与虚拟现实是计算机图形学的一类典型应用,而基于真实感的物理模拟正是这些应用背后的技术支撑,具有重要研究意义。基于真实感的物理模拟由于问题本身的高计算
镁合金具有比重小、绿色环保等优点,日益成为汽车、航空航天以及电子消费品等领域的重要材料。但是,镁合金的耐腐蚀性能较差,这一直是阻碍其进一步应用的主要因素,也是镁合金研究
基于浏览器的偷渡式下载攻击(Drive-by Download Attacks)已经成为当前最具威胁的恶意攻击方式之一。与正常的弹出式下载方式不同,偷渡式下载攻击在不与用户交互的情况下利用系
作为功能特性非常丰富的嵌入式多媒体操作系统,Android因具有优良的跨平台特性,和强大的多媒体特性,以及软件开发的便捷性和开源特点,发展至今日,已延伸到了整个移动终端领域
云计算以其虚拟化、按需服务等特点吸引了越来越多的应用系统迁移到云上。但是,云平台底层基础设施的高度复杂性使得云数据中心会经受大量的故障,并降低云应用系统的可靠性。
语音分离包括人声与人声的分离、人声与噪声的分离,本文主要的研究工作是人声与噪声的分离,也称为语音增强。随着人工智能的日益发展,语音交互技术在现实生活的应用日益广泛,
基于图符的地球村语言——和,目前涉及到5707个图符,而随着即时通讯工具——和音的推广及语料库——和画的完善,用户及图符数量会持续增长,使得从海量的和画信息中找寻用户感