特征融合和集成学习在房价预测中的应用研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:jematrix
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在房价预测技术研究和应用中,由于房价交易数据获取的不确定性,导致在构建等间隔时序序列时会出现数据缺失问题,而现有的研究并未过多考虑这些缺失问题所带来的影响。同时,现有的研究通过集成学习的方式让预测模型可以提取更多的特征,但都未过多考虑政策和经济因素所带来的影响以及多个模型的训练问题。因此,针对构建时序序列时所出现的数据缺失问题、政策和经济因素的影响以及多个模型的训练问题,本论文提出的解决方案如下:1.提出了一种基于时间衰减函数的房价长短期记忆预测模型(简称AD_LSTM),以降低时序序列中因数据缺失对模型训练产生的影响。该模型在LSTM的忘记门之前加入子空间分解和时间衰减函数:子空间分解可以将记忆矩阵分解成最优子空间,修正缺失项所带来的错误记忆;时间衰减函数可以根据当前记录和上一个记录之间出现的缺失项来对记忆矩阵进行衰减。在时间衰减运算过程中,以缺失项的数目作为权重来对记忆矩阵进行更改,以此感知缺失项的存在。把改进的AD_LSTM模型用于在北京市房价数据集进行实验验证,实验结果相较于已选择的基准模型,AD_LSTM能更好地降低缺失项所带来的影响,具有更低的预测误差。2.提出了一种基于注意力机制的房价预测集成模型,用于将房价数据集中的时序特征和多维特征进行融合以进行房价预测。在进行房价预测时不仅要考虑房价随时间变化的因素,还要考虑多维特征的影响。集成模型的构建过程为:首先对影响房价的多维特征进行分析和选择,构建基于多维特征的BP神经网络房价预测模型。然后引入协同注意力机制将基于多维特征的BP神经网络房价预测模型和AD_LSTM模型进行集成训练,得到最终的集成模型。通过设置对比实验进行验证,构建的集成模型具有更低的预测误差。最终根据集成预测模型设计与实现一个房价预测系统,该系统可根据用户输入的房屋信息得到未来6个月的房价预测结果,并对预测结果进行可视化。
其他文献
人脸活体检测是生物认证防伪领域内的重要研究课题,在日常生活中有着广泛的应用。目前,研究者们为了更有效地对真实人脸与伪造人脸进行分类,在不同的方向进行了研究。早期伪造人脸的质量与类型存在一定的缺陷,人脸活体检测方法主要通过纹理与图像质量等特征对其进行区分;随着伪造人脸的类型逐渐丰富,制作逐渐精细,目前主要利用深度学习、辅助信息等方法对其进行区分。然而,现有方法在面对单个数据集或单一维度的伪造人脸攻击
学位
时间序列是将某种统计指标的数值,按时间先后顺序排列所形成的序列。时间序列存在于众多领域之中,对其进行数据挖掘分析也是当今的研究热点之一。在对数据进行聚类,分类和回归等常见的时间序列数据挖掘任务之前,通常都会计算时间序列之间的相似度,计算结果在后续挖掘分析中起到了很大的作用,但时间序列相似性度量方法的设计与具体的应用密切相关。动态时间弯曲算法DTW(Dynamic Time Warping)是时间序
学位
主要回顾正念自我照护和专业生活品质的概念、测量工具和理论机制,介绍安宁疗护从业人员正念自我照护与专业生活品质的研究现状及相关干预方案,在此基础上,对正念自我照护在专业生活品质的研究方向提出展望,以期提高安宁疗护从业人员专业生活品质,为引导其用积极、有效的应对方式面对同情疲劳提供参考。
期刊
联盟链,是由多个组织共同管理维护的去中心化的分布式账本。由于记录在链表上的数据具有透明性和不可篡改性等性质,工作节点能够快速验证交易的合法性,同时用户的身份信息和交易细节也被暴露给参与者。环签名作为一种特殊的数字签名,它将签名者的私钥隐藏在公钥列表中,实现匿名签名的效果,适用于对隐私需求较高的多方协作场景。因此,本文基于环签名对联盟链当前存在的用户身份隐私和可监管问题展开相关研究,主要研究工作如下
学位
随着卫星遥感系统的快速发展,遥感图像在灾害预警、森林植被监测、军事探测等方面得到了广泛应用。然而,由于技术的限制,单个传感器无法同时获得具有高分辨率光谱域和空间域的遥感图像。因此,在实际应用中,需将光谱分量和空间分量进行组合处理,通过全色锐化获得高空间分辨率的多光谱图像。近年来深度学习已经被广泛应用于全色锐化任务,并取得了显著的成果。但大多数方法无法有效地寻求图像间的映射关系,亦或缺乏针对整体网络
学位
随着城市信息化进程的加快,路网中传感器逐年增多,交通数据呈现爆炸式增长。但由于建设成本的限制和建设时间的不同,路网中的传感器质量参差不齐,在数据的采集、传输和存储的过程中不可避免的存在数据丢失的问题。高质量的交通数据是智能交通系统(Intelligent Transportation System,ITS)构建的基础,数据的缺失为后续的工作带来极大的挑战,是当今智能交通系统构建及智慧城市发展亟需解
学位
区块链技术因为具有去中心化、安全可靠的特点正在被广泛应用于社会生活的各个领域中。共识算法作为确保区块链系统中各个节点行为达成一致的底层关键技术,其性能直接影响着区块链系统的运行效率。当共识网络中的节点数目增加时,各个节点间的通信量也会增加导致系统的效率降低。为了提升联盟区块链系统的运行效率,本文研究了实用拜占庭容错算法的运行机制并进行了改进,主要研究内容和创新如下:1.针对现有的共识算法没有考虑到
学位
在市场经济下,工业生产企业自负盈亏,各单位管理人员将利润提升问题作为管理工作重心。因此会计工作,就从最单纯的记账、会计核算,提高到为生产企业管理人员提供令人信服的决策数据,该过程涉及了企业的成本管理和产品销售价格。本量利分析方法是企业经营管理会计工作的一个基本方式,一般运用在企业生产经营管理工作决策中。文章以非标机械制造企业为例,首先介绍了本量利分析方法的定义以及包括的重要工作内容,并剖析了它在企
期刊
个性化新闻推荐是网络新闻服务的一项重要任务。随着深度学习的发展,以端到端的方式直接从原始数据中学习关于新闻内容和用户兴趣的向量表示逐步成为研究热点。得益于各种有效的表示学习方法,基于神经网络的新闻推荐模型层见叠出,成绩非常出色。然而当焦点集中在如何构造或应用更加先进的神经网络模型时,许多研究忽略了对新闻内容信息的充分探索。经调查,现有方法在学习新闻表示时没有对正文文本进行有效利用,并且在利用主题信
学位
随着信息网络的飞快发展,人们每天通过网络传输着海量的隐私数据,数据传输的安全等问题也随之产生。信息隐藏技术通过隐藏隐私数据的存在,实现隐私数据传输的安全性保护。而文本作为日常生活中信息传输的载体,使用深度学习语言模型,实现文本隐写,对信息隐藏领域的发展具有重大的推动作用。然而现有的文本隐写方法生成的短隐写文本隐藏容量较小、多样性较差、使用场景有限。为了解决文本隐写所存在的问题,本文从多组主题约束和
学位