相异度相关论文
摘要:K-means算法从样本集随机选取初始聚类中心导致聚类结果不稳定,且聚类性能易受奇异点影响。针对以上缺陷,文章定义基于相异度矩......
离群检测是数据挖掘研究的一个重要内容,其目的是消除噪音或发现潜在的、有意义的知识。空间离群检测是指根据空间对象的属性和空......
现代通信技术的高速发展以及移动智能终端的普及,使得人们对电信业务质量的要求越来越高,电信运营商可以通过提升业务质量来赢得用......
摘 要: 针对传统K-means算法的聚类不稳定性,提出一种基于相异度与邻域的初始聚类中心选择算法。该算法首先构造相异度矩阵,建立每个......
数据流的聚类是数据流挖掘的一个重要问题.提出一种针对混合属性的数据流聚类算法,它采用相异度来代替普通的聚类距离,并将等价相......
生物序列分析中的基于k-mer的非比对统计算法作为对传统比对方法的补充和发展已逐渐成为生物信息学研究中的一个热点领域。非比对......
聚类是分析和探测数据的重要方法,而图聚类则是一种非常重要的特征模式聚类的变体。以无向非加权连通图为研究对象,提出了一种基于......
在数据挖掘中我们往往会忽略离群数据,可是这些数据却往往包含重要的信息。本文采用了将决策树与相异度相结合的方式进行离群数据......
针对基于遗传算法的选播QoS路由算法易于收敛于局部的问题,把相异度的思想引入到遗传算法中,改进了遗传操作(选择、交叉和变异);同时引......
图是实体及其关系建模的一种常见方法并广泛地运用于Internet,Web结构,社团网络等的结构描述。在面对图中两个邻接结点的度都非常......
电子商务网站包含相当大的用户访问信息,对用户信息的数据挖掘,可以加强网站对用户访问信息的准确了解,提高电子商务网站的点击率......
为解决数据集样本维数较高时已有粒子群优化K均值算法计算速度较慢且聚类结果不稳定的问题,利用第1阶段聚类层次凝聚聚类获得准确......
提出了基于哈夫曼树的支持向量机多分类方法,该方法首先将1个多分类问题分解为多个2分类问题,针对每个2分类问题使用支持向量机2分类......
针对k—means算法在聚类前必须给出聚类个数的不足,本文利用类内相异度和类间相异度对该算法进行改进,试图在初始输入条件只有初始数......
聚类就是按照一定的要求和规律对事物进行区分和分类的过程。在这一过程中没有任何关于类别的先验知识,也没有教师的指导,仅靠事物间......
测试性日益成为现代电子产品的重要性能指标,必须在系统研制初期进行测试性设计,从而在故障诊断过程中,测试费用最少、诊断时间最短;根......
传统的用于Web日志聚类的算法大都需要用户指定聚类个数。提出了一种新的自适应聚类算法并时Web日志用户会话进行聚类。该算法基于......
系统发生树代表了不同物种之间进化关系的历史。生物信息学中的一个基本问题是对系统发生树进行比较。一种比较方法是通过定义树空......
当前应用在带钢表面缺陷图像的基于单个系数点的融合规则和基于区域系数特征的融合规则存在片面性、容易使融合图像失真等问题.针......
为了提高虹膜图像分类的准确性和稳定性,提出了一种基于最小最大概率机的虹膜图像分类方法.该方法通过控制错分概率实现分类的最大......
k-prototypes是处理包含数值属性和分类属性混合数据主要的聚类算法,但由于对初始点的随机选择极易使聚类结果陷入局部最优,导致聚类......
交通网络的快速发展带来了复杂的路径选择问题,现实世界的多变性更增加了其复杂性,比如2003年4月北京突如其来的非典疫情就增加了出......
空间例外是和其空间邻域对象不一致的数据对象。检测空间例外在地理信息系统和空间数据库的许多应用中是非常有用的。这些应用领域......
聚类是数据挖掘中重要的研究课题。文章介绍了聚类,讨论了聚类分析中的数据类型及其相异度,概括了数据挖掘中常用的聚类方法。最后,提......
针对在层次聚类算法中。一个分裂或合并被执行,就不能修正,其聚类质量受到限制的缺陷,提出了利用簇间相异度及基于信息熵或整体相似度......
根据Excel教学大纲的要求,总结出Excel考核的若干知识点,根据这些知识点提出了基于VBA技术的自动阅卷算法,并引入数据挖掘中的相异......
多维标度法是进行数据挖掘常用的方法之一,这种方法将对象之间复杂的关系用相对简单的点距离表示出来,现在广泛应用于心理学、地质学......
详细讨论了PAM算法,包括PAM算法的基本思想,PAM算法的描述,代价函数的计算,相异度的计算等,然后给出了用C++实现PAM算法的程序段。......
MPRM(Mixed-Polarity Reed-Muller)最小化是RM(Reed-Muller)电路逻辑综合过程中一个非常重要的阶段,对于输入数较多的布尔函数,传统遗......
聚类分析是数据挖掘领域广泛使用的一种技术,可以自动发现隐含在数据集中的分类模式。学分制体系下的学生选课数据可以看作分类属......
计算机支持的协作学习研究大部分只依据个别定量属性计算学习者之间的差异度,进而根据某种算法对学习者进行分组,分组结果并不能反......
本文提出了一种改进的基于粒子群优化的快速K均值算法,有效地克服了K均值算法对初始聚类中心敏感和容易陷入局部最优从而影响聚类......
引用监督学习策略,定义类内和类间不同的距离度量方式,以替代原来的欧式距离度量,实现对拉普拉斯特征映射算法的改进。将降维之后......
摘 要:在聚类分析中,距离及差异性(或相似性)度量方法是最基础的概念,度量方法的选择直接影响聚类结果的质量。本文在已有聚类算法的基......
流媒体代理服务器缓存是有效缓解服务器负载、减少主干网传输的关键技术,而推荐算法是根据用户历史点播行为预测将被点播的可能性。......
本文在相异度理论的基础上,提出了类间相异度的度量方法,从而以粗糙集理论为属性约简工具,利用相异度理论进行类的泛化和特化.构造出了......
模式匹配是串处理系统中最重要的操作之一,如何提高匹配效率是关键问题.提出一种基于贪心原理的模式匹配方法,运用最优化原理分析模式......
当前层次划分社团算法难以选取合适的初始节点,导致社团结构划分结果较差。为此,提出一种基于节点相异度的层次社团划分算法。给出度......
通过对基于K-prototypes算法对混合属性数据处理的聚类问题进行研究,改进了K-prototypes算法中分类属性相异度计算公式,使之能更加......
针对传统协同过滤推荐算法的不足,提出一种新的推荐算法,该算法重新诠释专家与用户的关系。首先,结合全局专业指数和局部活跃指数......
提出了相异度导引的有监督鉴别分析方法(D-SDA)。结合模式局部信息和全局信息,定义了类内散度权重矩阵R~W和类间散度权重矩阵R~B,......
网格技术是高性能计算机研究的热点.网格资源的表示是网格研究的重要部分.针对不同的网格资源,提出了一种二元变量法.以二元变量法......
在多输入多输出(MIMO)天线选择技术中,穷举搜索算法获得了最优性能,但其复杂度太高,通常无法应用于实时通信.传统基于相关度的次优天......
在介绍孤立点的定义以及现有孤立点挖掘方法(如基于统计的方法、基于距离的方法、基于进化论的方法等等)的基础上,提出一种基于相异度......
目前常用的几种基于划分的聚类方法主要处理数值型数据,能有效处理实际应用领域中常用的包括数值和符号混合数据的聚类算法则较少......
为提高CLARANS算法的准确性和执行效率,利用网格聚类算法对数据空间进行划分的思想,结合统计信息网格算法,对算法初始节点和邻居节点......
针对现有直觉模糊集合间距离度量的局限性,提出一种基于加权Minkowski距离的相异度度量方法。该度量方法适合于连续论域中集合间距......
为有效解决KNN算法在文本分类时效率随着数据规模的增大而降低这一问题,提出基于K中心点(K-Medoids)和粗糙集(rough set)的KNN分类......