梯度提升相关论文
近年来,致密油气在油气田开发中所占比重持续增加。致密油气由于其原始地层孔隙度和渗透率较低,采用常规方式生产较难获得工业油流......
CO2的浓度近几年急剧上升,引起了广泛的关注。卫星遥感已成为监测全球大气CO2浓度不可或缺的技术手段,也正在成为国际认可的全球碳核......
随着工业机器人应用领域越来越广泛,精准评估整机性能以实现机器人在各种场合下高效高精高可靠性的应用并充分发挥性能优势越来越......
针对线性回归、SVR以及大部分多变量回归树等回归模型不能直接利用分类型属性进行回归分析的问题,提出了一种可联合多种类型属性的......
随着机器学习和数据挖掘的发展,如何分析材料数据并给出用于实际生产中的决策,日趋成为材料信息学领域重点研究的内容。通过机器学习......
针对数据不平衡背景下的航班延误分类预测问题,提出一种非线性赋权的极限梯度提升(eXtreme Gradient Boosting, XGBoost)算法。基......
GBDT(Gradient Boosting Decision Tree)是一个应用广泛、效果好的监督式机器学习模型。它于2001年由Friedman提出,由决策树(Decisi......
宏基因组学可以直接从环境样本中提取微生物的DNA,已成为研究微生物的重要方法之一。叠连群是宏基因组学的基本研究对象之一,叠连......
众所周知回归决策树模型具有对结果的明确直观的解释性,使其在应用上广受欢迎。但它往往有着准确性不足的缺点,这使得其应用受到了......
图像显著性区域检测是模仿人类视觉注意机制,将视觉场景中的显著对象提取出来,从而使计算机具备类似人的视觉主动性和选择性的一种......
时间序列分类(TSC)是数据挖掘领域中重要且富有挑战性的问题之一.首先将时间序列数据按照Gramian Angular Summation/Difference F......
为了确定多标签分类器链方法的链序以及挖掘出高阶标签关联性,提出了一种基于梯度提升的多标签分类器链方法.给出了GBCC整体框架,......
应用Catboost构建树模型的分割指标作为特征选择度量标准,在原始前向搜索策略的基础上,结合两种度量标准计算综合加权值进行特征搜......
提出了一种基于决策树C4.5的多示例学习算法C4.5-MI,通过拓展C4.5的熵函数和信息增益比来适应多示例学习框架.应用梯度提升方法对C......
针对探地雷达A-scan数据检测多类公路深层病害准确率不高的问题,首先通过实地数据采集、钻芯取样技术,结合数据预处理和专家解释过......
通过使用非正常手段模拟人类操作行为,绕过验证码系统,黑客工具就可以向系统后台发起批量请求,实现对系统的攻击,从而给系统的正常......
异常检测是一个涉及诸多研究领域和应用场景的重要问题。大多数关于异常检测的研究都是在特定的应用场景下进行的,例如网络环境中......
针对糖尿病数据特征维度较高,单一分类器过度拟合导致性能受限,不能较好对糖尿病进行分类识别这一问题,提出了一种深度置信网(Deep......
半导体制造是一个大批量多阶段生产的系统,工艺技术复杂、工序步骤繁多,稍有不慎就可能使晶圆的表面和内部产生缺陷,从而影响生产......
浅层学习模型对复杂函数表示能力有限,从而导致泛化能力受到制约。针对此问题,结合深度学习和集成学习思想提出一种基于深度梯度提......
近年来,广义线性模型已被广泛用于车险定价,而一些研究结果显示机器学习在某些方面优于广义线性模型,但这些结果都只是基于某个单......
轮对在列车走行过程中起着导向、承受以及传递载荷的作用,其踏面及轮缘磨耗对地铁列车运行安全性和钢轨的寿命都将产生重要影响.根......
随着光伏发电产业的发展,相关技术水平提升,并网光伏发电成本大幅降低,太阳能转化效率也得到了提高。此外,由于面临严峻的环境能源......
基于凸优化中的对偶理论,提出了一种具有遗忘特性的在线学习算法框架。其中,Hinge函数的Fenehel对偶变换是将基本学习问题由批量学习......
[目的/意义]旨在深入研究情境信息对用户偏好的影响,提高情境感知推荐的准确性。[方法/过程]提出了基于梯度提升决策树的情境感知......
征信市场是社会主义市场经济体系不可分割的一部分,近年来,随着大数据技术的迅猛发展,我国的个人信用评估行业进入新的阶段。其中,......
微博的信息多元化、言论自由、爆炸式地传播速度等特点助长了谣言消息的生成和传播,使得微博成为了虚假不实消息传播的理想场所。......
航空发动机为飞机提供推力,它是飞机最重要的组件之一。诸如推力、喘振边界等性能参数对于安全而有效地调整航空发动机的运行提供......
改革开放以来,国家集中精力进行经济建设,工业化进程急速加快,但是,与此同时带来了十分严重的环境污染。其中空气污染是近些年来人......
数字图像的分辨率表示图像系统所能分辨的最小目标尺寸,若同一场景的图像像素密度越高,则图像的分辨率就越高,所包含的细节信息就......
蛋白质是人类机体的重要组成并且机体内几乎所有的活动都需要具有特定功能的蛋白质参与。蛋白质的空间结构决定其主要功能。因此对......
论文的第一个工作是关于集成学习的研究。在机器学习领域,我们把具备从经验知识中学习能力的系统或者模型叫做学习器。一般来说训......
近年来,机器学习方法在各个领域内的应用十分广泛,而特征挖掘则是机器学习过程中十分重要的数据预处理过程。Boruta算法是一种基于......
通过分析城市轨道交通日均客流及相关影响因素的变化特征,以多种因素作为数据集特征,采用梯度提升法和随机森林的混合模型对日均客......
帕金森病(Parkinsons Disease,PD)是一种常见的神经系统变性疾病,在继阿尔茨海默氏症后被列为世界第二常见疾病。患者数量的大量增......
为了准确、快速地对铁路物流需求量进行预测,针对现有铁路物流需求量预测模型存在的问题,采用梯度提升算法对分类与回归树算法进行......
近年来,随着中国经济的平稳快速发展,城乡工业化建设和工业、交通规模持续扩大,工厂建设的越来越多,机动车保有量逐年攀升等情况带......
众所周知,心脏是人体血液循环的中心,承担着使人体各器官正常运转的重任。血压是由心脏产生的人体非常重要的物理信号之一,正常人......