基尼指数相关论文
AdaBoost算法是一种将多个基学习器通过合理策略结合生成强学习器的集成算法,其性能取决于基学习器的准确率和多样性。但弱学习器......
期刊
介绍了机器学习的背景、及决策树的基本概念、决策树学习的基本过程,以及其中最重要的特征选择的依据:信息增益和基尼指数,重点研究了......
质量控制图作为一种统计管理工具,在工业质量管理上的重要性愈发明显,它是一种由横纵坐标和上下界限构成的统计图,通过图上的打点......
针对现有决策树算法对连续性数据分类的信息丢失、效果不佳等缺点,提出一种邻域决策树(NDT)构造算法.首先,挖掘了邻域决策信息系统......
以地级市及以上城市为研究单元,运用基尼模型测算我国27个省级行政单位的城市规模基尼指数和城市经济基尼指数,通过商值法计算基尼......
随着WWW的迅猛发展,Web上聚集了海量的信息,因此如何快速、准确而全面的获取有用信息已经成为巨大的挑战。基于人工智能的信息内容的......
摘要:目前,全球粮食系统以低成本、高效率的方式生产和分配粮食。尽管如此,粮食系统生产的粮食仍然难以养活每个人,而且还对环境造成不......
目前对决策树(Decision Tree,DT)分类问题的相关研究已取得了很多成果,但仍存在一些问题,如决策树在寻找最优切分点时需要遍历特征......
道路裂纹检测是道路日常管理中的重要工作,基于机器视觉的缺陷检测方法已广泛应用于道路裂纹检测。基于图像处理的方法需要人工提......
数据挖掘是近年来出现的一种综合了机器学习、统计学、数据库等众多领域的新技术.而决策树技术是数据挖掘的核心技术,应用广泛.本......
期刊
近日的凤凰卫视《华闻大直播》,讨论关于收入分配不公平的问题,请来两名学者,一名经济学家,一名社会学家,但是两个人的观点却是相......
本文主要采用基尼指数度量了广西各地区经济差距的状况及变化趋势,分析结果表明广西的地区经济差距在缓慢扩大,但比全国的地区经济......
本文利用对比较分析法,从二元经济的调节、初次分配和收入再分配三个方面分析了日本在经济高速增长时期仍能保持低基尼指数的原因。......
当前,国际经济体系中的危机因素还没有得到根本性的消除,各国政府都在寻求良策以谋求社会发展的稳定性,发展中国家尤其面临这种不......
随着基础理论研究所取得的一系列进展,分布估计算法逐渐成为进化计算研究领域的一个新的研究方向,并成为当今国际进化算法研究的新......
无论利用何种决策树算法,在构造决策树的过程中最关键的问题是确定每个节点的最优分支属性,以及相应属性的最佳分割点.本文分析了......
本文以基尼系数代表贫富差距水平,以GDP代表经济水平,运用spearman相关系数分析各国贫富差距与经济水平的关系,而后又运用聚类分析......
随着基础理论研究所取得的一系列进展,分布估计算法逐渐成为进化计算研究领域的一个新的研究方向,并成为当今国际进化算法研究的新热......
目前,关于n-grams特征加权的计算方法大多是基于其出现频率进行设计的。这类加权计算方式存在一定的问题:n-grams特征是由多个词汇......
文本自动分类中特征选择和加权的目的是为了降低文本特征空间维数、去除噪音和提高分类精度。传统的特征选择方案筛选出的特征往往......
文本分类中特征质量的好坏,会直接影响到分类的准确率,从特征提取这一环节出发,实现了一种改进的基于基尼指数的特征提取方法Gini,......
在满足健康不公平度量的一般偏好基础下,根据我们的特殊偏好确定具体的健康不公平指数,对健康不公平度量具有重要的实践意义。......
通过对SPRINT、RAINFOREST等传统决策树算法改进,使其能够适应不断生长的训练集,生成一棵与旧树相关的树;改进后的算法,新样本一来即可......
中国出口额占GDP40%,高于世界上任何国家,受欧美市场不景气的影响,整个经济体必将承受巨大压力。改革开放以来,贫富两极化趋势愈加明显,......
随着网上信息的极大丰富,文本分类技术显得越发重要,且预处理技术已成为文本分类的瓶颈.在预处理中采用TF-IDF算法,并且根据基尼指......
分析了各种因素对工序质量损失的影响,提出了工序质量损失率概念,建立了基于决策树、K-均值聚类和基尼指数相结合的工序质量损失原因......
使用基尼指数原理进行了文本特征选择的研究,构造了基于基尼指数的适合于文本特征选择的评估函数。结合fkNN和SVM两种不同的分类方......
介绍了决策树分类技术,并用其对汽车销售企业的调查问卷进行数据分析,挖掘出最近一年内有购车意愿的客户的特征,从而提高营销的成......
为了刻画山东省城市规模分布特点,以市区非农业人口作为城市规模的特征量,选取山东省建制城市1990—2008年的相关数据,采用首位度......
随着网络技术的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。常采用向量空间模型来表示文本,将文本看作特征空间的一......
本文以基尼系数代表贫富差距水平,以GDP代表经济水平,运用spearman相关系数分析各国贫富差距与经济水平的关系,而后又运用聚类分析......
通过对不同类型车间作业调度问题的描述,分析各类问题之间的共性特征,提出了一种基于基尼指数的遗传算法.该算法结合进化生态学和决策......
目的分析武汉市卫生资源配置的公平性,为优化区域卫生资源配置提供依据。方法采用基尼系数和泰尔指数分析2005年、2009年和2013年......
基于无线传感网和人工智能等新技术,采用LoRa技术进行数据传输,设计了一种基于智能决策树和无线传感网的林火预测和预警系统。系统......
我国在发展经济的过程中,贫富差距问题一直受到广泛关注。经济学家们为解决该问题提出了很多方案,政府相关部门也出台了相应的对策......
双目标CD-CAT的测验结果既可用于形成性评估也可用于终结性评估。基尼指数可度量随机变量的不确定性程度,值越小则随机变量的不确......
选取我国省域范围内地级市、副省级城市以及直辖市作为研究对象,以2007年和2017年城市户籍总人口和地区生产总值两项指标为基础,利......
目的:探讨发展中国家经济发展对全民健康及医疗保障制度的影响。方法:对10个发展中国家2003—2011年的经济、健康官方数据进行回顾......
目的:本研究将透过收集患者资料和血液标本,通过随机森林算法构建筛查阻塞型睡眠呼吸暂停低通气综合征(obstructive sleep apnea-h......
信息时代的快速发展使得数据的采集、传输变得更加容易,数据规模也呈现指数式增长的趋势。这样庞大的数据中蕴藏着巨大的价值,所以......
超高维数据的收集与存储,因科学技术的飞速发展已不再是问题.那么随之就面临着如何分析此类数据的困难.众所周知,超高维数据,即数......
近几年许多行业都步入大数据时代,但数据挖掘技术在我国保险领域的应用相对不多,并且我国保险公司也要考虑通过改变传统的经营方法......
对长三角、珠三角和京津冀等十大城市群进行实证分析.引入基尼模型计算城市规模基尼指数和城市经济基尼指数,求出基尼商指数判断其......
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,各行各业积累了大量的历史数据,而这些激增的历史数据中往往隐藏着很多重要......
中枢辐射式航线网络被美国、欧洲和中国主要航空公司广泛采用,但如何评价此类航线网络的运营质量和效率,国内还很少有相关研究。本......
本文通过对草地群落物种数比例与生物量比例之间的关系研究,建立了草地群落植物种等级划分的方法,验证了该方法的合理性;并首次用......
密度峰值聚类算法(Density Peaks Clustering,DPC),是一种基于密度的聚类算法,该算法具有不需要指定聚类参数,能够发现非球状簇等......