基于知识的问答系统的设计与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:huajinxiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的快速发展和互联网的日渐普及,问答系统凭借其回复简洁精确、实用度高的特性,受到人们的广泛认可,在实际生活中的使用越来越频繁。传统的问答系统忽略了借助知识对问题本身进行深入的语义理解,而且对于具有明确指令的专业领域缺乏针对性回复,整体的交互能力有限,回复的丰富性欠佳。基于以上现状,本文设计实现了基于知识的问答系统,依靠相关知识对问题进行深度语义理解,根据用户问题、用户属性、所属知识领域及相关候选知识集生成回复。系统包括协调模块、指令模板回复模块、深度学习回复模块、默认回复模块、问答交互模块共五部分。协调模块负责合理调用指令模板回复模块、深度学习回复模块、默认回复模块,以响应不同情况下的用户问题,返回系统回复。指令模板回复模块用于具有明确指令的领域,通过检索获取回复模板集,填充模板生成系统回复。深度学习回复模块包括以下六部分:(1)通过规则化处理从用户问题中提取出对应实体;(2)采用Pylucene搜索引擎对标注数据集和百科知识数据集构建知识索引库,根据规则化后的用户问题和所属知识领域检索出对应知识集;(3)知识筛选单元对检索出的知识集进行筛选,将筛选合格的知识集作为基于知识的回复生成模型的候选知识集;(4)依据Transformer结构设计基于知识的回复生成模型,将规则化后的用户问题、用户年龄属性、所属知识领域以及通过筛选的候选知识集作为模型输入,使用模型生成回复语句;(5)回复质量检测单元负责评测模型生成回复的合理性和困惑度,将检测合格的回复作为深度学习回复模块的回复语句输出;(6)使用MySQL数据库建立缓存单元,初始化时预存储由模型生成且质量检测合格的回复。在获取到规则化后的用户问题后,先在缓存中查询该实体是否已有对应的回复集,如果有则从回复集中随机选择一条作为系统回复,提高回复效率;若没有对应的缓存回复集,再根据前述五部分的流程生成回复并更新缓存。默认回复模块随机选取默认语句作为系统回复,保障在指令模板回复和深度学习回复都没有生成合格回复时系统的及时响应。问答交互模块采用B/S架构和前后端分离模式,使用Vue.js框架和Python-Flask框架搭建问答交互平台,通过交互界面获取用户问题、年龄属性、所属知识领域,访问服务器以获取对应的系统回复等数据,实现问答交互。
其他文献
随着社会的发展以及能源需求与日俱增,大力发展以光伏为代表的可再生能源,进而实现能源的可持续发展,已经成为各国研究人员和决策者的共识。随着光伏机组渗透率的不断提高,其对传统电力系统的影响也越来越大,当电网受到扰动或者发生故障时,光伏系统突然脱网将会电网造成严重后果,因此国家电网公司在并网接入标准中明确要求大型光伏电站应具有一定的电网支撑能力。本文首先介绍了光伏并网系统中的各个组成部分,包括光伏阵列、
学位
在众多类型的无线电能传输技术中,适用于电动汽车大功率供电的磁耦合谐振式无线电能传输(Magnetically Coupled Resonant Wireless Power Transfer,MCRWPT)技术凭借其传输效率高、抗偏移能力强的优点受到广泛研究。本文基于零电压开关(Zero Voltage Switching,ZVS)技术,针对双LCC型电动汽车MCRWPT系统在轻量化、高效率、高稳
学位
日益严重的能源与环境问题使得发展氢能产业成为未来趋势,燃料电池汽车作为氢能利用的一种典型的应用场景,是汽车工业可持续发展的重要方向。双有源桥变换器因其功率密度高、允许功率双向传输、原副边电气隔离等诸多优点,特别适合于燃料电池电气系统,受到广泛关注。在选取双有源桥变换器作为核心拓扑的基础上,快速的启动及暂态响应能力,高稳定、高精度的输出特性已成为燃料电池汽车电气系统典型需求。因此,本文以燃料电池车用
学位
电机作为交通运输、航空航天、能源发电等领域的关键部件,要求其具有高功率密度、高效率和高可靠性等性能,同时由于稀土永磁体的价格逐年上浮,稀土永磁电机的成本也成为关键考量因素之一。根据永磁体的配置方式,可以分为表贴式永磁同步电机、内置式永磁同步电机和表面镶嵌式永磁同步电机(Surface Inset Permanent Magnet Synchronous Motor,简称SIPMSM)。其中,SIP
学位
气体绝缘金属封闭输电线路(gas insulated transmission line,GIL)因其电压等级高、电磁辐射小、敷设灵活性强等优点具有广阔的发展前景。在实际GIL生产、组装、输运和运行过程中将会产生球形、线形等金属微粒,带电微粒受到库伦力、重力、气体黏滞力等作用力,在GIL腔体运动或者吸附在绝缘子表面,使周围电场发生畸变,从而导致气体击穿或者绝缘子发生沿面闪络,降低GIL的绝缘性能,
学位
多相电机倚其容错能力强、转矩脉动小、功率密度大、运行效率高等优点,在航空航天、船舶动力推进和电动汽车等领域受到越来越多的关注。为实现多相电机高性能驱动,位置传感器的使用必不可少,但位置传感器的使用不仅会增大电机尺寸、增加系统成本,进一步可能成为系统的故障来源,降低了系统的可靠性,这在对电机可靠性高的场合是难以接受的。因此无传感器控制被学者们提出并被不断完善。在众多的无位置传感器控制策略中,高频信号
学位
随着风电相关技术的逐渐成熟与节能减排压力的增大,全球累计风电装机容量占电网比例逐步升高。但是风能具有明显的随机波动性和间歇性,这使得风电的接入可能会对电网的安全和电能的质量造成严重的冲击,大规模风电的并网稳定成了风电发展的一项严峻挑战。对风电场的输出功率进行多时间尺度的提前预测可一定程度解决此问题,根据预测结果,可以用于风电实时并网控制,提前调整调度计划,同时准确的功率预测可减少电力系统用于维稳的
学位
在“双碳”目标的驱动下,风、光、水等清洁能源发电将持续快速发展,大规模清洁能源的集中并网成为必然趋势。柔性直流电网在清洁能源消纳方面优势显著,在面向未来更大规模清洁能源并网及更远距离、更大容量的电能传输方面,具有广阔的发展前景。然而,柔性直流电网直流线路故障发展速度极快,过流程度严重,甚至威胁系统的稳定运行,这就对直流线路快速保护和故障识别提出了更高的要求。对此,本文深入分析了直流线路区内外故障时
学位
大气压低温等离子体射流在生物医学领域已有较广的应用。研究表明,当使用等离子体射流辐照生物组织时,预期的生物医学效应主要是通过反应生成的活性物质与生物组织的相互作用产生的。等离子体射流能够产生多种活性物质,等离子体在水溶液中的传质中,电子参与活性物质之间的协同作用,并在其中起着重要而积极的作用。因此,对等离子体射流中电子的行为有一个系统和深入的了解,具有重要的意义。本文建立并使用基于针板放电结构的一
学位
作为电能传输过程中的关键设备,变压器的停运往往会带来较大的影响,直接关乎社会经济和安全问题。但长期工作条件下,变压器不可避免地会出现绝缘劣化和局部放电(partial discharge,PD)问题,绝缘劣化会产生局部放电,而局部放电又会加剧绝缘问题,将局部放电作为绝缘状态的一个外在表现研究得到了广泛应用。基于目前国内外局部放电检测研究现状,本文设计和使用了超宽频带法,将脉冲电流的测量频段极大拓宽
学位