【摘 要】
:
利用机器学习算法对数据进行分类、处理和分析,进而对个人年收入做出预测。通过微软Azure Machine Learning平台中所给的数据进行数据分离,将数据中70%用于训练,30%用于测试来构成预测模型;利用机器学习中二元决策丛林、二元贝叶斯机器分类器、二元神经网络、二元支持向量机、二元逻辑回归、二元提升决策树这六种算法对个人年收入进行预测,预测评估中综合了正确率、精度、召回率、F值和AUC。预测结果表明二元提升决策树算法针对个人年收入实验中准确率最佳。
论文部分内容阅读
利用机器学习算法对数据进行分类、处理和分析,进而对个人年收入做出预测。通过微软Azure Machine Learning平台中所给的数据进行数据分离,将数据中70%用于训练,30%用于测试来构成预测模型;利用机器学习中二元决策丛林、二元贝叶斯机器分类器、二元神经网络、二元支持向量机、二元逻辑回归、二元提升决策树这六种算法对个人年收入进行预测,预测评估中综合了正确率、精度、召回率、F值和AUC。预测结果表明二元提升决策树算法针对个人年收入实验中准确率最佳。
其他文献
以七味白术散总苷的提取率为响应值,煎煮时间、提取次数、料液比为考察因素,采用Box-Behnken响应面法设计3因素3水平分析试验,用2,3-二硝基水杨酸法(DNS)检测七味白术散总苷含量。结果表明:七味白术散总苷的最佳提取工艺为煎煮时间53 min、提取次数2次、料液比1∶13.7(g/mL),在此工艺下,七味白术散总苷的平均提取率提升至(0.71±0.01)%。
针对学校班集体活动中,学生所面临的个人或集体相册随时随地分享和管理上的困难,提出了基于UML的相册管理系统的需求分析与建模方法。利用统一建模语言,首先对系统所需各模块进行功能分析和建模,然后完成系统静态模型和动态模型的建模,最后结合系统案例展示所需的相册管理系统。需求分析与建模结果表明,基于UML的相册管理系统能够作为学生对班集体活动中产生的相片资源或个人相片资源进行管理的有效平台,同时满足人们在日常生活中随时随地管理智能设备中的本地相册资源。
选用种植于雪峰山脉海拔1 000 m的槠叶齐、潇湘红21-3、碧香早、尖波黄 13 号、白毫早及保靖黄金茶1号这6个茶树品种的鲜叶为原料,采用同一红茶加工工艺,对样茶进行感官审评与理化成分分析。结果表明:潇湘红21-3和槠叶齐加工的新化红茶滋味浓强、收敛性强,汤色红浓亮,产品具有明显的品质优势,其中潇湘红21-3甜香带品种特有的花香,香气持久,槠叶齐甜香持久;保靖黄金茶1号的品质极具有特色,加工的新化红茶甜香带花香,香气悠长,滋味甘醇,带鲜爽;槠叶齐、保靖黄金茶1号和潇湘红21-3的茶黄素含量为0.44%
兴趣点(point of interest,POI)是目前地理信息平台的重要组成数据之一。随着地理信息平台的广泛应用,如何解决海量POI数据表达的拥挤、压盖等冲突现象,进行快速的分级筛选,成为迫切需要解决的问题。针对以上难点,探讨了POI多尺度表达策略的影响因素,提出了基于多重影响因子控制的POI分级筛选流程。通过"天地图·山东"地理信息公共服务平台POI的处理实践表明,该方法处理的POI结果分级
针对在组件评估等领域利用组件信息流(component information fl ow,CIF)度量和基于多维方法的度量理解建立起组件提供者和使用者之间联结,通过度量组件式软件系统(component-built software system,CBSS)的设计,软件开发、测试以及维护人员能够定位系统的薄弱环节,评估出测试和维护系统所需要的代价。提出了一种基于内部组件流和外部组件流的CIF度量方法,一系列评估组件设计尺寸对CBSS设计质量的影响的基于CIF的准则。通过理论和应用验证,表明了基于设计尺寸
为提高非线性系统的辨识能力,利用神经网络具有逼近任意非线性函数的优点,提出了基于SSA-Elman非线性系统辨识方法。首先利用系统输入和输出数据作为Elman神经网络的输入和输出进行网络训练;其次针对Elman神经网络易出现局部极小化、收敛速度慢以及难以正确选取网络权值和阈值的初始值的缺点,选用了麻雀搜索算法对其进行优化;最后选用MATLAB作为仿真环境进行数值仿真。实验结果表明,对于非线性系统辨识的问题上,基于麻雀搜索算法优化的Elman神经网络能有效地降低系统辨识误差。
采用DEA-Malmquist 指数法,依据2008—2018 年的湖南省各州市面板数据计算湖南省的农业全要素生产率,运用多元回归方程分析了农业基础设施对农业全要素生产率的影响。实证结果表明:灌溉设施和农村基础设施用电量对农业全要素生产率的增长有显著影响。且灌溉设施具有负相关性,电力用量具有正相关性,而公路设施则对农业全要素生产率无显著相关性。因此,应当对加强对农村公路建设,大力发展农村电力建设,也要完善灌溉系统,发挥农村基础设施的积极作用。
为更好地实现网络通信性能的评估,从而不断提高网络性能,提出了基于BP神经网络理论的现场总线网络通信性能评价方法。针对CAN总线网络特点,建立CAN总线通信网络的性能评估指标体系,并且构建BP神经网络的结构模型,基于此模型对选择的训练样本进行学习,最后随机选取10组数据对BP网络评价模型进行测试。结果表明,待测样本的网络输出与期望输出误差极小,评估结果可以与实际测试数据非常好的吻合。证实应用BP神经网络方法能够有效并且准确地对CAN总线通信性能进行评价。
信号分选是电子侦察系统的组成部分之一,在愈发复杂的电磁环境中变得非常重要。文中提出一种基于多线程并行处理的高低重频信号分选方法。该方法在处理过程中将高低重频雷达信号分别处理,并利用线程间的通信结果对输入的脉冲描述字(pulse description word)进行筛选过滤。利用流式处理的思想,剔除高重频雷达信号的同时,做到了对可能存在的低重频雷达脉冲描述字的累积,低重频处理线程对筛选后的PDW进行低重频分选,针对高低重频信号同时存在的电磁环境,文中方法可以达到良好的效果。
为了掌握在风干扰工况下太阳光导入器系统跟踪情况和系统的鲁棒性,文章提出了一种添加神经网络的滑模比例积分微分(proportional-integral-derivative,PID)控制器。首先基于直流电机建立俯仰角传动系统数学模型,在数学模型基础上建立滑模PID控制器,再添加径向基(radial basis function,RBF)神经网络对风干扰补偿。在matlab/simulink中进行仿真,对比滑模PID控制器与RBF网络滑模PID控制器的仿真结果表明,后者可有效降低抖振现象,对风干扰的敏感性明