【摘 要】
:
分类是数据挖掘领域研究中的核心技术之一。得到一个性能良好的分类器需要大量的训练样本,而对样本进行标记是一个十分消耗资源的过程,对多标签样本进行标记就更加困难。为了
论文部分内容阅读
分类是数据挖掘领域研究中的核心技术之一。得到一个性能良好的分类器需要大量的训练样本,而对样本进行标记是一个十分消耗资源的过程,对多标签样本进行标记就更加困难。为了尽可能降低标记样本的成本,需要找出最能代表类别信息的样本。在基于SVM的分类方法中,分类器间隔越大,分类的精度就会越差。提出了一种基于期望间隔的主动学习方法,即依据当前分类器,选择最快缩小分类间隔的样本。通过实验证明,基于期望间隔的学习策略比基于决策值以及基于后验概率的策略有着更好的学习效果。
其他文献
把动态特性引入到有限普通集合X内,改进了普通集合X,提出了P-集合(packet sets);P-集合是由内P-集合X^F(internal packet set X^F)与外P-集合XF(outer packet set XF)构成的集合对;
模糊认知图(Fuzzy Cognitive Map,FCM)作为知识表示、推理和软计算方法,通过在传统认知图模型中引入模糊测度来量化概念(concept)间因果关系的影响程度,近年来已成为国内外的研究
提出了一种小规模数据集下学习贝叶斯网络的有效算法——FCLBN。FCLBN利用bootstrap方法在给定的小样本数据集上进行重抽样,然后用在抽样后数据集上学到的贝叶斯网络来估计原
坐标系变换是合作完成某项测绘作业过程中经常遇到的问题,但因为关系到自身的安全与利益,合作双方都不希望泄露各自的输入信息。首次提出保护私有信息的坐标系变换问题,同时设计了相应的变换协议,并以此协议为基础,进一步设计了不同坐标系下两点距离计算协议,分析了两协议的正确性、安全性及复杂性。在保护私有信息的条件下,解决了不同坐标系下两点距离计算问题,并将其应用到目标定位准确性判断问题中。
以鲸鱼作为DTN移动节点,研究水声特殊环境下的网络QoS路由。针对网络能量和带宽受限的情况,提出一种基于节点移动模型的QoS路由算法。理论分析和实验表明,该算法在丢包率、能
谱聚类算法是一种流行的数据聚类方法,该算法使用特征分解技术计算邻接矩阵的特征解,但是在大规模数据集的情况下,因储存和计算的问题而无法进行求解。基于线性代数中对称矩
提出了一种新的基于L1范式的粒子群算法群体多样性定义,这种观测方式可以准确地描述算法运行过程中的信息。首先,通过对比新的观测方式和已有方式,解释了新的观测方式的特点;
在数据仓库系统中,OLAP查询一般都涉及多表连接和分组聚集两部分操作,提高这些查询的性能成为提高OLAP响应速度的关键。利用实物化视图,可以准确地计算并保存表连接或聚集等
动态目标具有空间性、时间性、多维性、海量性、复杂性和不确定性的特点,而传统的DBMS已不能有效地对其进行位置建模、语义表达、索引。首先,分析了动态目标数据建模、动态目
语义网需要能够以一种智能的方式来表示和处理模糊知识与数据信息,但最近的研究证明,OWL在数据类型表示方面存在严重的局限性:首先,它不能处理在语义网和本体中广泛存在的不精