样本权重相关论文
通过观察显微镜下的细胞组织结构和病变特征来进行的病理检查(Pathological examinations)是大多数疾病诊断的“金标准”,很多疾病的......
电力市场环境下短期电价预测面临全新挑战,其预测结果的准确性对市场主体报价决策具有重大意义。对此,本文提出一种基于样本权重的深......
随着数据爆炸时代的到来,如何高效快捷地挖掘出冗余数据中有价值的信息变得越来越重要。聚类分析是一种无标签、无监督学习的数据......
在当今大数据时代,数据的规模以指数级的速度快速增加,数据作为互联网的核心,其在人们生活中应用价值越显关键。如何通过技术手段......
目的针对不同的变量类型,采用基于设计的统计推断方法,选取第五次国家卫生服务调查陕西省代表性调查数据中的人均卫生支出与两周患......
针对AdaBoost算法不能有效提升NB(Naive Bayesian)的分类性能,提出一种改进的样本权重维护策略.权重的调整不仅依据样本是否分错,......
在过抽样技术研究中,为了合成较有意义的新样本,提出一种基于聚类的过抽样算法ClusteredSMOTE-Boost.过滤小类的噪声样本,将剩余的......
为了提高AdaBoost集成学习算法的数据分类性能,提出基于合群度-隶属度噪声检测及动态特征选择的改进AdaBoost算法.综合考虑待检测......
针对地下水质量评价中综合评价法的不足,应用信息熵计算评价指标的权重,并充分利用有序分隔概念,建立了基于熵权的属性识别模型。选择......
聚类技术可以用于对具有动态、随机和异步并发特性的出租车对象进行分类。但是,现有的聚类技术认为每个出租车样本对聚类的贡献相......
孪生支持向量机通过求解2个较小二次规划问题得到一对非平行超平面,从时间和准确率方面提高了分类器的性能.由于此方法使用Hinge损......
AdaBoost作为一种有效的集成学习方法,能够明显提高不稳定学习算法的分类正确率,但对稳定的Naive Bayesian分类算法的提升效果却不明......
在数据挖掘领域中,分类技术根据数据集中的数据训练出一个分类函数或构建出一个分类模型,对未知实例的类标号进行预测。在不平衡数......
不平衡数据分类是数据挖掘和机器学习领域的一个重要问题,其中数据重抽样方法是影响分类准确率的一个重要因素。针对现有不平衡数......
针对神经网络分类器训练时间长、泛化能力差的问题,提出了一种基于动态数据约简的神经网络分类器训练方法(DDR)。该训练方法在训练过......
本文通过分析当前数字资源评估的常用方法和一般过程,给出基于样本权重的数字资源评价指标体系构建方法,并根据层次分析法和功效系数......
针对不平衡数据集分类结果偏向多数类的问题,重采样技术是解决此问题的有效方法之一。而传统过采样算法易合成无效样本,欠采样方法......
目前,以生物信息学(Bioinformatics)为背景的研究广泛开展,研究人员利用机器学习、数据挖掘等数据分析方法来发现大量数据所隐含的......
互联网的逐渐成熟以及微博等社交媒体的发展极大的改变了人们的生活方式,越来越多的用户喜欢通过网络发布信息、查看实时信息以及......
应用传统模糊评判方法评价地下水质量时,通常以地下水质量标准为参考进行权重赋值,没有考虑由于水质复杂而引起的评价地区内部各取......
现实世界中广泛存在不平衡数据,其分类问题是数据挖掘和机器学习的一个研究热点.欠抽样是处理不平衡数据集的一种常用方法,其主要......
人脸检测是一种非接触性生物特征检测,以数据采集方便和应用范围广泛等特点,在数据挖掘和模式识别领域成为了一个热点研究课题。现代......
学位
提出一种AdaBoost算法中错分样本权重约束的方法,该方法对AdaBoost算法中多次错分样本数据的权重进行约束,当其超过一个阈值时,就......
传统的有监督学习方法限制于训练数据和测试数据必须服从独立同分布的假设,难以解决训练数据和测试数据分布偏移的问题。针对上述......
大数据时代,人类收集、存储、传输、管理数据的能力日益提高,各行各业已经积累了大量的数据资源,这些数据常呈现出多源性和异构性.......