价格预测中代价敏感的机器学习算法及优化

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:tlkj168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P汽车共享服务逐渐受到大众追捧,同时也吸引了来自学术界和企业界的关注。由于没有官方的定价标准,因此汽车共享服务中最重要的问题之一是预测汽车租赁价格。价格预测模型可以作为中间的定价模型,来避免过多的讨价还价过程。由于P2P的去中心化特点,预测出价格区间更为合适。
  解决价格区间预测问题的传统方法是通过分类算法解决回归问题,但它的三个弊端限制了此方法直接应用于 P2P 共享汽车服务的价格预测,分别是离群值影响了 K均值聚类结果的分布;区间的数量越多预测性能将会越差;深度森林忽略了不同错误分类情况的区别。为解决这些问题,本文做了如下研究:
  1)我们分析了离群值对K均值聚类的影响,根据K均值的均匀作用和孤立森林的启发,改进了K均值离散化方法。改进的K均值算法降低了离群值对K均值聚类的影响,这使得离散化所产生的区间宽度更加一致。
  2)对比传统算法和深度森林算法,我们发现深度森林的自适应深度可以使越差的分类性能获得更高的提升,这有助于缓解区间数量越多时分类性能越差的问题。这主要是因为,深度森林的自适应深度使得集成学习获得了足够的多样性,从而改进了集成学习的性能。这为深度森林开辟了新的应用领域;由于深度森林的基分类器可以是任意分类器,也使得深度森林的这一特点也为集成学习提供了借鉴。
  3)我们将代价敏感学习引入到深度森林中,提出了代价敏感深度森林算法。相较于传统深度森林,代价敏感深度森林可以在相同准确度下,获得更低的代价,也就是说,其错误分类的区间更加接近真实区间。代价敏感深度森林不仅可以利用于通过分类算法解决回归问题中,它还可以根据不同的代价矩阵,来解决不同的代价敏感问题。
  同时,整个模型也可以很容易地应用在其他领域的价格预测问题中。
其他文献
城市扩张是人类活动与地域背景环境在时间和空间上的演化过程与空间表达,城市扩张模式取决于区域内的经济发展需求和资源基础。干旱区绿洲城镇对水源的依赖性极强且生态环境脆弱,经济发展与生态环境有序并进有利于玛纳斯河流域的可持续化发展。为探究绿洲城市结构、城市化水平、城市扩张模式与驱动机制,寻找适合绿洲城市发展机制,本文基于玛纳斯河流域绿洲城镇结构现状,采用GIS空间分析方法、地理探测器等方法,以探究绿洲城
学位
土地资源是人类生存和发展的重要基石。随着全球经济的发展,城市人口迅速增长,城市规模也在不断扩大,生产用地、生活用地的扩张与生态空间用地之间的矛盾愈来愈烈。以石河子市为例的绿洲城市地区“三生空间”时空分异评价研究不仅对石河子市的国土配置优化有着重要意义,也对天山北坡经济带的可持续发展提供借鉴,因此选取石河子市为研究对象。通过参考国内外的相关研究,本文选择了2000年、2010年和2015年三期遥感影
学位
区域土地利用演变是一个复杂的多因素综合作用下的非线性变化过程。在当前土地供需矛盾日益加剧、土地资源利用问题逐渐凸显的关键阶段,对土地利用变化的研究具有重要的理论与现实意义。土地利用变化模型正是深入理解区域土地利用的动态演变过程、特点以及未来变化趋势的有力工具。本文以典型干旱区绿洲——叶尔羌河流域为研究区,基于景观生态学理论及方法,以1980年、1990年、2000年、2010年及2015年五期研究
学位
冰雪覆被是干旱区景观格局的重要组成类型,同时也是区域宝贵的固态水资源存储形式。近年来,受全球变化态势不断加剧以及人类活动干扰强度增加等因素的影响,新疆山区的冰雪覆被面积急剧退缩,直接导致了该区域水资源储备的大幅波动,干旱区绿洲景观格局也剧烈演变。这对于整个新疆地区的可持续发展及生态系统稳定是一个严峻的考验。因此,深入了解冰雪覆被景观的变化规律及特点,研究冰雪覆被变化与人为干扰间的耦合机制,探讨不同
学位
背景与目的:  非酒精性脂肪肝病(Non-alcoholicfattyliverdisease,NAFLD)是一种以肝脏脂质蓄积增加为主要临床表现,除长期饮酒或其它明确原因以外引起的慢性应激代谢性肝病。随着人们生活水平的提高和生活方式及饮食结构的转变,目前NAFLD已成为全球第一大慢性肝病。NAFLD与肝硬化、肝癌、心脑血管疾病及其它系统肿瘤密切相关,但由于它病程长、临床表现轻、筛查与诊断手段复杂
组织蛋白酶B(cathepsin B, CTSB)属于木瓜蛋白酶样半胱氨酸蛋白酶家族的一类水解酶,广泛存在于从病毒到哺乳动物和人等生物体内。CTSB催化作用是由半胱氨酸、组氨酸和天冬酰胺三个保守氨基酸组成的催化中心实现。CTSB的结构由信号肽(signal sequence)、前体肽(prosequence)和成熟序列(mature sequence)组成。在成熟序列中,CTSB具有一段额外的插入
过氧化物酶(Peroxidase,POD)是一类广泛存在于细菌,真菌,植物和动物中的氧化还原酶,可利用过氧化氢来介导多种无机和有机底物的氧化。大多POD是单一多肽链与含Fe(Ⅲ)-原卟啉IX辅基构成的血红素蛋白,多肽链分子须与血红素结合才构成全酶,血红素辅基是POD电子传递的载体。III类POD是来源于植物的分泌型过氧化物酶,在胞质中合成后可以转运至细胞壁或液泡,参与多种生理功能,如机体内毒性过氧
在众多的环境内分泌干扰物中,类固醇雌激素是已知的最有效的内分泌干扰物质物质,且其具有污染范围广,致畸性强和难降解的特点。水生生态系统中类固醇激素的出现和持续存在已成为危害公众健康的一个重要问题。微生物降解是环境中类固醇激素清除的主要途径,然而国内外对微生物降解类固醇激素的代谢途径及机制的研究还很少。前期研究已经表明来自海洋红球菌P14(Rhodococcussp.P14)能以多种类固醇激素为唯一碳
学位
广东省纺织品进出口股份有限公司(以下简称"广东省纺")是广东省丝绸纺织集团有限公司所属二级子集团,是一家集贸易、设计、生产、服务为一体的科工贸相结合的现代化企业。广东省纺作为中国最早从事纺织品服装出口的企业之一,有60多年纺织品服装出口的经验积累和在国际纺织品服装市场上的良好声誉。公司注册资本为1.3亿元,主要经营纺织品服装的进出口业务,2018年进出口总额3.3
学位