【摘 要】
:
智能问答系统是信息检索的高级表现形式,能够更加准确地理解用户用自然语言提出的问题,并通过检索语料库、知识图谱或问答知识库的方式,返回简洁、准确的匹配答案。在日常搜索场景下,相比较传统的自然结果罗列,智能问答系统可以展现更加优质的结果,从而大幅度提升了用户的体验。在最初的问答系统中,问答数据一般离线产生于复杂的阅读理解模型,并以字典的形式存储为k-v对(例如问题-答案对)。只有当用户的问题完全命中字
论文部分内容阅读
智能问答系统是信息检索的高级表现形式,能够更加准确地理解用户用自然语言提出的问题,并通过检索语料库、知识图谱或问答知识库的方式,返回简洁、准确的匹配答案。在日常搜索场景下,相比较传统的自然结果罗列,智能问答系统可以展现更加优质的结果,从而大幅度提升了用户的体验。在最初的问答系统中,问答数据一般离线产生于复杂的阅读理解模型,并以字典的形式存储为k-v对(例如问题-答案对)。只有当用户的问题完全命中字典中储存的“问题-答案对”时,才会展现出相应的答案。现今,随着语音搜索和移动搜索的发展,在大数据场景下,用户的口语表达日趋多样,这种键值对的匹配方式将无法满足搜索场景的需要,从而导致优质内容展现不足。因此,我们需要将语义相近的问题和问题库中的答案进行相对应的匹配,尤其针对长尾低频的问题,找到与其含义一致且在问题库中的高频键值对,即构建高效且准确的在线FAQ智能问答系统。首先,在传统场景下,基于关键字词匹配的检索方法及人工模板的FAQ问答系统由于扩展性受限,难以解决同义不同词的语义鸿沟问题,例如检索“脑袋疼是什么情况”和“为啥我头痛”,会因关键词不一致而导致漏召回。所以,如何克服语义鸿沟,提高检索的召回率将是一个很大的挑战。其次,近几年随着深度神经网络的发展,深度文本匹配模型在一定程度上解决了文本间的语义匹配问题。然而这些模型大多是基于学术界公开的数据集进行设计与优化,在真实的场景中,会因文本表达的多样性,对用户问题的理解与分析存在偏差而导致通用性受限。例如,“如何从北京到芝加哥”和“如何从芝加哥到北京”,极有可能被误匹配。口语化、歧义、省略和冗余等现象不可避免地降低了 SOAT神经网络模型的灵活性和鲁棒性。因此,如何灵活的匹配真实的用户问题将是另一个挑战。基于上述内容,本文提出了一个完全基于语义信息,包含检索模块、匹配模块的在线FAQ智能问答系统,旨在代替传统的检索方式和人工模板方式。在检索模块中,基于向量检索,从海量候选问题库中抽取数十条候选集合;在匹配模块中,引入搜索分析的多个先验信号进行多粒度输入。此外,整个问答系统在模型设计上还兼顾性能与效率,且满足工业场景中的实时性要求。本文通过在真实的数据集和公开数据集上进行了大量实验,研究结果表明,本文所提出的模型在匹配效果及效率上均具有显著的优越性。
其他文献
在“大众旅游”的时代背景下,旅游业发展态势迅猛,带来的经济效益显著,但随着旅游规模逐步扩大,破坏了旅游生态系统平衡,且旅游资源的盲目开发和利用对旅游生态系统造成诸多影响不容忽视,旅游生态系统健康成为我国迫切需要关注的问题。我国目前的旅游生态系统健康如何?呈现怎样的时空分布特征?动态变化速度和转移概率是怎样的?影响旅游生态系统健康的因素有哪些?这一系列问题都是促进旅游生态系统健康亟待解决的重要问题。
大多数被子植物的种子在成熟后处于休眠状态,种子从休眠到萌发不仅需要适宜的环境条件,还包括复杂的细胞内部调控过程。之前有许多研究发现等离子体处理植物种子能够促进其萌发,然而对等离子体促进种子萌发的机理人们了解的不多。为了探究等离子体对玉米种子发芽的影响以及可能的作用机理,本文以玉米种子为材料,研究空气冷等离子体促进玉米种子萌发的过程中植物激素、信号分子H_2O_2、NO以及组蛋白乙酰化之间的调控关系
随着经济社会的快速发展,国土开发与资源环境承载力的不匹配、国土开发利用效率不高等问题日益突出。因此,有必要对生态敏感脆弱带的山地型-泸定县进行国土空间规划研究,为制定科学合理、简明清晰的城市化战略格局、农业化战略格局和生态安全战略格局规划提供科学的理论依据。基于泸定县2016年土地利用现状图和相关基础资料(国土、环保、农业、林业、气象等)构建指标体系;运用层次分析法、综合分析法、自然断点法对该县域
目的:通过对需要经皮椎间孔镜治疗腰椎间盘突出症患者行浮针操作,研究浮针在经皮椎间孔镜治疗腰椎间盘突出症术中腰痛控制的疗效和安全性。方法:本研究收集广东省中医院大学城医院骨科2019年4月至2020年1月因腰椎间盘突出需要行初次经皮椎间孔镜治疗的病人50例。研究者将患者随机分为试验组(常规手术治疗基础上加上浮针辅助治疗)与对照组(常规手术治疗)各25例,并记录患者基本信息。入院后完善静息状态、消毒铺
克深8气田巴什基奇克组属于裂缝性砂岩储层,储层基质物性较差,裂缝的存在改善了其渗透率,极大地提高了产气能力,因此搞清该区的裂缝发育特征、分布规律及有效性将为后续的开
目的本研究目的在于制备出高特异性的抗HPV16L1 IgY抗体,为HVPL1蛋白的检测提供一种方法,同时探讨IgY抗体在免疫组织化学中的应用。方法用纯化HPV1611蛋白免疫母鸡,分别收集
全球气候变暖,是当今人类面临的重要挑战,而阻止全球变暖的关键就是减少碳排放。近年来,中国越来越重视环境保护,并采取了一系列积极的对策,如:产业结构升级、开发新能源以及建设全国碳排放权交易市场等,促进了碳排放的减少。中国碳排放交易体系(ETS)在2017年底正式启动,进一步促进碳排放的减少,促进技术进步和产业结构升级。再者,随着消费者低碳意识的提高,大多数消费者更偏好购买低碳产品。面对国家低碳政策和
乳腺癌是引起人类死亡的恶性肿瘤之一,其发病率和死亡率在女性癌症中位居前列,因此研究乳腺癌的治疗方法对全球女性健康具有重要意义。化学疗法,尤其靶向药物治疗是目前临床上治疗乳腺癌最有效的方法之一,但是靶向药物治疗也面临着患者局限性和治疗耐药性等问题。因此,可以通过研发新的抗癌药物来解决乳腺癌的治疗问题,而小分子药物因具有易提纯,高效性,靶向性等优点一直是人们研究的热点。本论文重点开展了对小分子化合物V
在我国经济发展新常态条件下,珠宝零售市场己完全由以前的卖方市场转变为现今的买方市场,如何能让消费者在市场上众多珠宝品牌中青睐自己品牌就是珠宝零售企业营销的关键。和润美玉珠宝公司是一家专注于新疆和田玉籽料开采、雕琢以及销售为主要业务的机构。近几年来,和润美玉珠宝公司珠宝市场受到沉重的打击,市场缩减,营业额下降,如何以创新性的营销策略吸引顾客和留住顾客,成为和润美玉珠宝公司迫切需要探索的课题。本研究采
目的:利用Fazekas直观评分量表和纤维束示踪空间统计分析(Tract-based spatial statistics,TBSS)技术,定性定量分析脑小血管病(cerebral small vessel disease,CSVD)伴认知障碍患者的白质结构损害,探讨多模式磁共振(MRI)技术在CSVD致认知障碍中的应用价值。方法:自2018年1月至2019年12月,连续纳入我院就诊的CSVD伴认