结合机器学习算法与DEA的综合评价模型的研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:zyu03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据包络分析(DEA)是一种评价包含多输入和多输出的样本之间相对有效性的方法,在确定有效以及最优得分的样本这一应用环境中,已被证明非常有效。但是,在应用的时候,此类方法存在两个问题,第一是需要人为设定权重本身或者权重的范围,这会带来了综合评价模型存在任意性的问题;第二是会产生太多的有效样本,这类结果在解释性上与实际存在偏差。本论文针对上述问题,结合回归和分类的思想,对传统的DEA模型分别进行改进。首先,样本评价的权重不同,会产生评价不客观的结果,针对DEA模型第一个产生非均一权重的问题,本论文通过结合样本回归的思想,构建得到统一权重的综合模型,以此达到各个样本得分均衡点,最终客观有效的评价系统的样本。其次,有效样本太多,往往在现实中不可能存在较多的有效样本。意味着模型评估过程中并没有充分利用给定指标,本论文通过引入结合强互补松弛条件的基础模型,可以从数学上保证最优变量乘数值为正,但同时这样的模型不能减少有效样本的数目,进一步考虑利用了DEA-DA的分类思想,构建基于分类的模型,实现对样本进行单一的综合排名。最后,对基于改进的DEA综合模型分别进行案例研究,第一个案例选取反映全国各省份的市场,政府,科技,社会,生态,全球化的相关指数,共31个样本地区,经过构建的共同权重模型运算,得到各地区和科技指标评分排名,结果表明全国各地区均有客观的评分;第二个案例选取反映全国各省份的质量安全,数量安全,经济安全,技术安全,生态安全,贸易安全的相关指数,共31个样本地区,首先经过传统的数据包络模型和结合了强互补松弛条件的模型分别运算,之后利用结合基于分类的评价模型运算,结果表明传统的数据包络模型得到有效样本和无效样本乘数存在值为0的情况,有效样本数较多,而结合了强互补松弛条件的模型通过改表有效样本数避免乘数值为0;在基于分类的最终评分排名中,产生了得分值为1的唯一有效样本地区,且各地区的综合评分差距显著。
其他文献
自动求解数学题是机器智能推理领域的一个重要子问题,用于解决这该问题的自动求解器通常为一种特定的机器智能系统。广义的来说,在推理任务中,机器智能体需要依据给予的信息(如事实描述或观测信号)和已有的先验(如模型结构和常识知识),在特定的限制下来解决特定的问题或者给出总结。更具体地,对于自动求解数学题系统,求解器需要依据给定的问题描述和数学先验知识,生成符合规范可计算的解题等式。该任务基于检测机器智能体
随着深度学习的兴起,越来越多领域开始使用深度神经网络和循环神经网络构建性能卓越的数据驱动的模型结构。比如在自动驾驶和智能安防等场景下,深度模型的出现使得这些技术出现了较大的进展,因为基于大规模数据的深度模型在自然情况下可以对图片进行高效、高准确性的计算和判断。但是有部分研究员们却发现深度模型存在一个比较严重的隐患,即通过对图片添加一些很小的扰动便可以导致模型做出错误的判断。在高性能要求的应用场景中
文本检测与识别的相关工作在我们的日常生活中随处可见,如身份证识别、停车场的车牌识别等,极大地方便了人们的生活。不同应用场景下文本内容形态多样,尺度差异较大,语义背景也往往不同,需针对性地设计检测与识别算法以取得更好的实操效果。本文基于民国报纸标题检测与识别这一具体中文场景任务展开,该工作有利于将纸质报纸转化成能检索能查询的数字馆藏,进而挖掘其史料价值。我们对基于深度学习的文本检测与识别工作进行研究
自主装修机器人在执行各种任务时需要在装修环境中来回移动。自主路径规划能力是一个移动机器人智能化的重要衡量因素。这要求移动机器人能够主动感知环境信息,然后利用环境信息做出导航决策。在动态环境中,移动机器人对于环境全局信息的认知是不足的,其通过传感器主动感知环境局部信息来规划自己的路径。因此,对环境信息理解和利用的能力是移动机器人实现自主路径规划的关键。本文主要的工作如下:1.使用ROS和Gazebo
微博、微信等网络社交媒体的兴起标志着自媒体时代的到来,自媒体新闻有着广阔的传播覆盖面,对自媒体新闻进行情感分析有利于了解社会公众对公共事件的整体态度和看法。目前,得益于众多电商平台完备的评价体系,商品、电影评论等领域已经有很多规范的中文情感数据集。然而对于其他非特定领域,由于缺乏相应的评价体系,数据标签的获得只能依赖成本高昂的人工标注,这就导致大量深度学习任务都普遍面临着小数据和非平衡的问题,而且
随着微电子技术、通信技术和信号处理技术的快速发展,可穿戴生理信号采集系统成为可能,并逐渐成为研究热点。一方面,如心电(electrocardiograph,ECG)、脑电(electroencephalograph,EEG)、肌电(electromyography,EMG)等生理信号的实时采集,实现了对心血管疾病、癫痫等患者的长期监护,达到了及时治疗和预防的目的,缩短了医患交互的时间和空间,降低了
过去十几年来,用户对带宽的需求一直呈指数级增长,在未来很长的时间里,这种增长趋势会一直保持。作为电信基础设施的骨干技术,光纤通信技术的进步支撑着互联网和移动互联网业务的发展,但受限于熔融光纤的非线性效应,单模光纤传输容量的理论极限大约为100 Tb/s,近几年的实验结果表明,以单模光纤为传输媒介的通信系统的传输容量,已经越来越接近其理论极限,即将面临“带宽瓶颈”。在这种背景下,空分复用技术作为突破
随着“中国制造2025”战略的逐步深化,自动化生产和智能化生产具有越来越重要的地位,作为工业基础的数控机床的重要性也在与日俱增,在航空航天领域中尤其如此。在航空制造业中,为了减轻飞机的重量,同时要保证飞机结构的高强度和较长的使用寿命,薄壁零件成为一种极好的选择,已经被广泛应用于航空制造业中。然而由于薄壁零件具有壁厚较小、体积较大、结构较为复杂等特点,数控机床对其进行加工具有较大的难度,难以保证其加
随钻测井是指测井仪器随钻头一起下井工作,在钻井的同时进行测井工作,并把测量结果实时传输至地面,随钻密度测井是其中的代表技术之一,本文的研究内容就是围绕随钻密度测井仪器展开。测井结果的实时性是随钻测井技术独特的优势,但同时也对仪器的实时数据处理能力有着很高的要求。实时数据处理包括对原始数据的计算和存储,二者在工作流程中的关联性越低,数据处理流程的稳定性越高。Flash均衡算法旨在通过一定的策略,使得
随着生物特征识别系统安全性和准确性需求的增加,指静脉识别受到广泛地研究。与其他生物特征相比,指静脉识别自带活体识别,安全性更高,使用更加便捷,因此具有重要的研究意义。随着深度学习技术的发展,指静脉识别算法的效果也在逐渐提高。特征提取是指静脉识别算法的研究重点之一,如何提取具有较好识别性的特征仍然存在挑战。为了提高特征的判别性,本文研究了一种增加特征判别性的损失函数。为了提取更多的语义信息,本文设计