用子空间粒子群聚类算法识别Folksonomy标签冗余的研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:xiaziaipao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0标签系统中经常包含很多冗余的标签,标签冗余会增加用户选择喜好项目时的负担,从而影响用户建模和对推荐系统的评估。标签数据集通常存在着大量不相关或是冗余的特征,而不同簇之间的相关特征子集又是不一样的,所以应该从不同的特征子集中来发现簇。提出使用子空间粒子群聚类识别标签冗余,算法采用指数型变权类似K-means的目标函数,该函数对变量权值的改变更加敏感。在此基础上利用粒子群优化目标函数搜寻得到全局最优的标签聚类,提高抽取冗余标签的准确度。实验结果表明,此算法具有较强的全局搜索能力,应用于标签冗余识别
其他文献
网格安全是网格中的一个重要组成部分,它直接影响着网格的发展和网格系统软件的实际应用。为了充分描述网格环境下的信息流动情况,扩展了一般网络环境下的主体、客体,利用客
功能点分析法是一种使用非常广泛的软件规模估算方法。主要针对IFPUG(International Function PointUser Group)提出的功能点分析法在划分功能组件复杂度等级时所存在的不连续
针对动态社区挖掘问题进行分析和研究,基于优先情节和增长定律,根据节点的度数分布,提出以时间为轴动态模拟社会网络的形成演化机制,同时进行社区划分。以Zachary Club和Les
针对标准中心性测度不适用于非联通网络这一问题,提出了基于资源分配策略的复杂网络中心性测度。节点的资源分配中心性测度定义为节点从其它节点接受的资源量,如果一个节点从
网络虚拟化体系实现了在同一共享底层架构之上同时运行多个虚拟网络。然而,构建多异构网络并存的、可灵活配置的虚拟网络平台具有一定的挑战性,不仅需要减少虚拟网络之间的交
针对无线传感器网络多基站多源路由问题,提出一种基于k-Anycast技术的路由协议,研究了多基站无线传感器网络中的最大生命期问题。首先根据数据能耗和数据流量守恒建立混合整
作为一种重要的认证数据结构,认证跳表在数据认证机制中有着广泛的应用。由于哈希模式对认证跳表的代价有显著的影响,因此提出哈希模式和数据存储模式分离的思想,设计了一种
详细阐述了GTK+和Samba的基本概念与关键技术,介绍了一种Sun Solaris系统下的开发图形用户界面GUI(Graphic User Interface)的方法。在Windows系统下利用GTK+开发GUI,并通过S
体系结构是系统的高层抽象和集成蓝图,基于形式化方法描述和分析体系结构能在系统开发早期发现体系结构层面的错误并提升体系结构的质量。基于体系结构的πADL形式化规约,结
基于朝鲜语信息检索系统的深入分析,研究提高朝鲜语信息检索性能的索引问题。通过剖析名词单位索引法、单位词素索引法、n-gram单位索引法、单位语句索引法等经典索引法的优