旅游知识库问答系统的构建技术研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:zhenzhurujun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们的生活水平在不断地提高,许多人将旅游作为自己精神生活的一部分。在如今的大数据时代,网络上充满着复杂的旅游攻略信息,而传统的搜索引擎会返回大量网页给游客,游客仍需花时间从网页中提取自己需要的信息,所以传统的搜索引擎已经无法满足人们的需求。如何高效返回精准的信息给用户是目前亟待解决的问题,而引入知识库问答系统则是解决这个问题的切入点之一。知识库问答系统给用户提供一种高效、准确地获取信息的方式,它能够返回简短且准确的答案给用户。因此,构建旅游知识库问答系统可以有效地解决游客收集信息过程中需要耗费大量时间的问题。所以本文主要研究旅游知识库问答系统在构建过程中涉及到的三个比较重要的技术:知识库的构建技术、对问句进行实体识别以及结合知识库对问句进行属性提取。具体内容如下:1.构建旅游知识库整合各类网站的旅游信息。互联网上的通用领域知识库无法满足具体领域的日常研究需求,所以本文以广西地区为例,构建了广西旅游景点知识库。2.基于实体存储网络的实体识别。针对目前许多基于神经网络的模型从数据集中提取出的句子特征在语义上不连贯的问题。本文提出一种存储网络模型,将提取出的局部语言特征存储起来,再结合注意力机制来扩展局部语言特征的作用范围。实验结果表明,本文提出的实体识别方法在两个不同领域的数据集上都取得了较好的效果。3.基于信息交互矩阵的问句属性提取。针对主流方法只考虑高层语义信息而忽视字级别的文本信息交互的问题,本文提出了一种构造问句与属性信息的交互矩阵来进行属性提取的方法。问句在文字级别上包含了部分和属性相似的信息,本文构建了问句和属性的信息交互矩阵,通过卷积的方法提取交互信息,最后将交互信息和高层语义信息联合,从而从知识库中选出最合适的属性。实验结果表明,本文提出的属性提取方法取得了较好的效果。
其他文献
情感作为人类生活和经验中最基本的现象,存在于所有语言及文化团体中。然而,要将这种抽象的、与个人主观感受紧密相连的现象概念化并表达出来并非易事,为此隐喻提供了一个重要的渠道。本文的隐喻概念从莱考夫/约翰逊的概念隐喻理论框架出发,将隐喻看作是一种认知现象,而非传统隐喻理论中所认为的偏离正常语言使用的一种修辞方式,人们的概念系统本质上是隐喻的,且隐喻具有普遍性和文化特殊性。基于这些特性,隐喻成为解译分析
由于生物特征识别技术的安全系数较高,其使用范围也愈加广泛,如今正逐步取代传统的身份识别方法。生物特征识别的种类有很多,如人脸识别、虹膜识别、指纹识别、步态识别、掌纹识别等,其中最为常用的是人脸识别和指纹识别。但这几种识别方式都存在着被伪造的可能,有一定的安全隐患。而手指静脉识别由于其本身的特点,被识别对象必须为活体,且静脉处于皮肤表面之下,难以伪造,因此手指静脉识别技术的安全性更高,与其它识别技术
抗日战争作为中华民族历史的关键节点,作为世界反法西斯战争的重要组成部分,这种史诗级的地位和深远的意义使其一直以来备受世人瞩目。主流媒体微信公号如何进行内容生产、采用何种传播策略关系到抗日战争历史在未来的延续和生存问题,因而对这一主题的研究是十分必要的。本文将“人民日报”、“新华社”、“央视新闻”这三大典型主流微信公众号确立为研究对象,选取2014年1月1日至2018年12月31日的推文进行内容分析
船舶工业是关乎国家经济发展的战略性产业,加快船舶工业的发展对提升我国经济实力,维护经济稳定具有重要作用。《中国制造2025》提出加快物联网与船舶工业的深度融合,引导船舶工业向绿色化、智能化方向发展,一方面可以节约资源,改善环境,提高生态效益,另一方面提高船舶附加值,增强竞争力,更好地满足市场需求。物联网环境的动态性增加了船舶发展过程中的不确定性,因此从系统的观点出发,分析和调整原有的商业模式对促进
“法律就是一种预测,要想真正的认识法律,就要从坏人的眼光去看待它”,这是霍姆斯对法律这个命题的独特理解。他塑造出“坏人”这一形象作为法律修辞工具,为人们认识和学习法
水力压裂是在砂砾岩储层改造时经常使用的一种高效的增产技术。在水力压裂的过程中,水力裂缝在井底形成并向地层延伸,裂缝在岩石中不断扩展、转向、分叉和聚集,最终形成具有复杂几何形态的缝网。在砂砾岩压裂中,水力裂缝与砾石之间的相互作用影响着缝网的复杂程度,新的研究成果发现,在砾石与岩石基质之间,存在着一个薄过渡区,可将这个过渡区看成弱界面。因此利用最大拉应变准则和摩尔-库伦准则研究水力裂缝与砾石的相互作用
清代珲春满文户口册是《珲春副都统衙门档》的构成要素之一,主要记载了清代珲春驻防区域内八旗人口的基本情况。其中,以满文编写的珲春户口册虽然时序断裂,但形成时间早,基本
高速高精度数控加工技术在航空领域、家用电器行业得到广泛的应用,是提高加工质量和效率的主要方法。数控加工主要利用直线(G01)和圆弧(G02或G03)指令实现刀路进给,加工路径的短线段连接处拐角轮廓误差无法确定,这种情况会造成机床剧烈振动,影响加工零件表面的质量。针对这一问题,本文旨在构造基于有限脉冲响应技术的加工路径轮廓误差精确插补算法,使得加工中的进给运动的速度和加速度连续,并且有效减小机床的振
我国IT行业经过了十多年的迅速发展已成长为国民经济第一大产业,一批互联网公司、高新技术企业的迅速崛起掀起了信息科技的浪潮。不仅如此,各行各业也纷纷开始进行信息化改革来为行业谋求更为高效的发展,其中尤为显著的是银行业。然而,过速的发展往往伴随着风险,随着IT行业逐步摆脱旧有的粗放扩张的发展模式,进入行业平稳、健康发展的新时期,起步晚发展慢的项目管理技术正成为制约这一转变的因素之一。目前,项目管理在I
聚四氢呋喃共聚醚橡胶材料于上世纪六十年代在德国研究生产,经过将近六十年的发展,目前该材料仅主要应用在生物医学材料上,作为印模材料应用在口腔临床方面。目前研究的比较少,又因为聚四氢呋喃的优异性能,该合成橡胶相比其他的橡胶具有非常高的强度,有极强的耐低温等优点,所以该材料具有非常诱人的研究前景。本研究提出一种新的环氧化合物-四氢呋喃共聚物的制备方法。所得共聚物为环氧化合物与四氢呋喃的交替共聚物,共聚物