基于深度学习的租房问答系统的研究与实现

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:testsininet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,信息爆炸和信息过载的问题逐渐明显,搜索引擎只能返回与人们需求相关的一系列网页,已经无法满足用户需要。在此背景下,问答系统的提出弥补了搜索引擎的缺陷,问答系统让用户以自然语言的方式提出问题,紧接着系统返回给用户准确、简洁的答案。近年来越来越多的研究人员尝试使用深度学习的方法完成问答领域的关键任务,并得到了较好的效果。因此,基于深度学习的问答系统逐渐成为国内外研究中自然语言处理领域最热门的研究方向之一。本文结合深度学习算法对用户自然语言进行理解,构建了一种基于CNN的租房领域问句意图识别模型(QIRCNN),以及一种基于BERT-Bi GRU-Attention-CRF的中文命名实体识别模型,并基于本文模型实现了一个基于租房领域知识库的问答系统。本文具体内容如下:本文首先介绍了本课题的研究背景与意义、国内外研究现状以及本论文的研究内容及章节安排。然后,简要介绍了本课题所需的相关理论与技术基础。接着,本文研究了基于深度学习的领域问答系统中的问句理解部分。在问句意图识别方面,本文将问句意图识别问题看成问句的多分类问题,在研究基于卷积神经网络的文本分类方法的基础上,将该方法用于识别租房领域问句的意图,构建了一种基于CNN的租房领域问句意图识别模型,并通过对比实验证明了所提模型的有效性。在命名实体的识别方面,本文将非限定值关键信息的提取问题看成命名实体识别问题,提出了一种新的命名实体识别模型,即BERT-Bi GRU-Attention-CRF模型。该模型使用经典Bi LSTM-CRF实体识别模型作为基础模型,用Bi GRU替换Bi LSTM使得参数更少,结构更简单,收敛性更好;采用预训练语言模型BERT训练中文词向量,能够较完整地保存文本语义信息,较好地解决了命名实体一词多义问题;使用Attention机制挖掘文本序列之间的潜在特征,对语义信息的利用更为充分。实验结果表明,本文的BERT-Bi GRU-Attention-CRF模型具有较高的识别准确率。之后,利用本文研究的深度学习模型,本文设计并实现了一个基于知识库的租房领域问答系统。分析了系统需求、设计了系统总体架构、功能模块和数据库表,整个系统包括知识图谱建立、意图识别、关键信息提取、问句转换和答案检索等模块,利用Python、XPath、Sparql等编码实现了本系统,并展示了系统运行的效果。最后,总结了全文并展望了进一步的研究工作。
其他文献
环境绩效合同服务是环境服务项目具体环境服务落实服务方法之一,也环境服务业中一种重要的商业模式。2011年以来我国已经开展按照双方约定环境质量收取服务费的综合性环境合同服务试点,2014年国务院办公厅《关于环境污染第三方治理的意见》的规定,第一次明确地将环境绩效合同服务引入第三方治理,环境绩效合同服务将在未来的环境服务业发展中以其“按效付费”的特别机制和高综合性,而成为环境服务业的主要服务方式。不难
本文对基于余能原理的基面力元法在再生混凝土细观损伤分析中的应用进行了课题研究,主要研究内容如下:1.深入学习了新型余能原理有限元法的相关理论知识,介绍了基面力的定义、弹性力学方程以及单元柔度矩阵表达式等。2.在已有的余能原理基面力元法MATLAB软件的基础上,考虑材料损伤问题。开发了适用于再生混凝土细观损伤问题的余能原理四边形基面力元非线性分析软件,并运用FORTRAN语言开发出了相应的网格自动剖
高分子材料具有较好的加工性能和优异的力学性能,被广泛运用于医疗、电子电器、航空航天等各个领域。当高分子材料作为结构功能使用时,主要考虑其弹性模量、屈服强度、断裂伸长比等。作为外观使用时,主要考虑其颜色、表面形貌和表面光泽。由于高分子材料具有较低的屈服强度和表面硬度,容易受到硬质物品刮擦,改变材料表面形貌和光泽度,影响材料表面美观性和功能性。根据这一问题,本文将研究高分子材料表面受到刮擦损伤后表面形
随着工业的快速发展,水体中的PPCPs污染越来越严重。不仅对水生生物造成危害,而且还会影响人体健康,因而对水体中PPCPs的去除进行研究具有重要意义。用于水中环丙沙星去除的
食品中金黄色葡萄球菌的定量检测方法主要为传统的平板培养,同时需要进行后续的生化鉴定,步骤繁琐,时间长,对于现场检测行不通。其次还有测试片法、显色培养基计数法、PCR技
社会经济的高速增长促进了民航业的迅速发展,民航运输量不断增大,飞机在当今交通运输中扮演着重要角色。与飞机离不开的话题就是安全问题,民航空管的首要任务和重要职责正是
随着人类社会的进步和经济的发展,大量的抗生素类物质随着城市污水或工业废水系统排入水环境中。尽管水环境中抗生素含量较低,但其潜在的生态风险也引起了全球关注。然而,污水厂的初级和二级常规生化处理对抗生素的去除效能有限。本研究提出了一种电氧化耦合陶瓷膜工艺(简称EO-CM耦合工艺)作为二级出水的深度处理工艺,旨在有效地去除抗生素类微污染物,同时工艺出水可作为回用水。首先,优选适配于EO-CM耦合工艺的阳
空化的发生会造成离心泵工作效率的下降,并诱发振动、压力脉冲和噪声等,严重影响其安全运行和使用寿命。因此,对离心泵空化状态进行监测和研究具有重大的意义。声发射(AE)技术作为一种先进的检测手段,对检测对象的运行无干扰,且对其状态变化敏感,能够有效地避开低频信号的干扰,可用于离心泵空化状态的检测。本文基于声发射检测技术对离心泵空化状态进行监测,分别采用多分辨奇异值分解(MRSVD)方法和改进变分模态分
【目的】采用前瞻性研究方法,以6~16岁注意缺陷多动障碍(Attention Deficit Hyperactivity Disorder,ADHD)儿童为研究对象,根据其父母童年期是否存在ADHD将患儿进行分组处理,探究父母童年期ADHD是否会对同病患儿药物疗效产生影响,从而为以后ADHD个别化治疗提供参考。【方法】采用方便抽样法纳入2018年12月至2019年12月在南京医科大学附属脑科医院儿
延安时期是中国共产党马克思主义理论教育发展和成熟的关键时期,当时高校马克思主义理论教育则是其中的突出代表。延安时期高校在马克思主义理论教育的内容和方法取得了开创性的成就,积累了丰富的马克思主义理论教育经验。对延安时期高校马克思主义理论教育的研究具有十分重要的意义,能够有效解决当前高校马克思主义理论教育中存在的问题,提高马克思主义理论教育的水平。在对延安时期高校马克思主义理论教育进行系统的研究后,梳