基于知识图谱的中华典籍问答系统研究

来源 :中北大学 | 被引量 : 0次 | 上传用户:yangke0248
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中华典籍浩如烟海,是中华民族记忆的载体,也是古圣先贤智慧的结晶。而花间集更是中华典籍中的一颗明珠,闪闪发光。但花间集中词的语言简练且作者善于用典故、时事来表述词的内涵,导致如今读起来较为晦涩难懂,不易理解。因此,若可以事先了解词的相关知识,再从词的“字-句-联-篇”中细细品味,能使我们更容易理解词的内蕴,为我们的精神世界提供更多滋养。随着信息技术的飞速发展,用户在获取知识时选择通过搜索引擎搜索答案。但利用搜索引擎搜索时,却存在检索到的信息答非所问、繁杂冗余等问题,造成用户难以精准的获取答案。问答系统不仅能解析问题,实现快速理解用户的意图,而且又将结果简化,直接为用户提供高质量的答案。基于知识图谱的问答系统更将知识以三元组的形式存储,实现了碎片化的知识体系化和整合化,为问答系统提供了高质量的数据,进一步方便了用户的查询使用。因此,本文以《花间集全译》为例,着重对信息抽取和知识图谱的构建两部分进行研究,即构建了命名实体识别模型和花间集知识图谱,同时搭建了基于知识图谱的问答系统。该系统能对用户的输入问题进行解析,查询知识图谱并返回答案,帮助用户更快更准确的获取知识,具有一定的实用性。本文的主要工作如下:(1)构建命名实体识别模型。由于词的词牌不同,实体位置也会有相应变化,且已标注好的词的语料相对较少,因此需要针对词的写作背景、作者想要表达的情感等对语料进行人工标注。故本文人工了标注《花间集全译》作为命名实体识别的数据集并提出AM-NER命名实体识别模型来识别实体。最后设计对比实验和消融实验,验证了该模型在本文所提数据集上的优越性。(2)构建花间集知识图谱。由于网络上存在着不同结构的知识,而且大量的知识存在于非结构化的数据中,因此需要采取不同的技术方法有针对性的进行知识获取和存储。故本文首先根据待爬取网站的特性,通过爬虫技术获取《花间集全译》中词的相关知识;其次将人工标注好的实体和不同数据源的知识进行知识融合、知识加工等过程,并将知识以三元组的形式存储,实现了花间集知识图谱的构建。(3)构建花间集问答系统。基于上述研究成果,本文实现了基于知识图谱的花间集问答系统,具体流程包括:问题解析、问题处理以及可视化展示。
其他文献
菜心(Brassica campestris L.ssp.Chinensis var.Utilis Tsen et Lee),又名菜薹,属十字花科芸薹属植物,因其富含糖类、维生素C、氨基酸等营养物质,深受全国消费者喜爱。花薹为菜心主要的食用器官,营养物质的积累大大影响菜心的口感和品质,这些初生代谢物在同一植物不同器官中含量有所差异。目前关于菜心不同器官的初生代谢产物的分配以及营养物质调控方面的研究
学位
原花色素作为葡萄中重要的多酚类化合物,对葡萄抗逆性及人类健康具有重要意义。前期研究表明VvMYBPA1/PA2与葡萄原花色素生物合成密切相关,但其分子调控网络尚不明确。本文采用亚细胞定位、瞬时过表达、酵母双杂交(Y2H)、双分子荧光互补(BiFC)、酵母单杂交(Y1H)等技术探究葡萄中VvMYBPA1/PA2调控葡萄原花色素生物合成的分子机制。主要结果如下:1.亚细胞定位试验表明,葡萄MYBPA1
学位
土木工程结构往往带裂纹工作,在疲劳荷载长期作用下,裂纹将会发生疲劳扩展并最终引发结构断裂破坏,由此可能导致人员伤亡。断裂力学是分析疲劳裂纹扩展问题的重要理论基础,而应力强度因子是断裂力学中的重要参数,可以用于结构抗疲劳设计或既有结构疲劳性能评估。本文充分发挥边界元法在求解裂纹应力强度因子方面的计算优势,以及有限元法在解决复杂结构问题方面的适用性优势,系统开展应力强度因子计算的边界元-有限元耦合法研
学位
随着我国建筑产业化不断深入发展和推广应用,作为建筑施工中不可或缺的模板脚手架体系,也在持续改进与创新,以满足实际工程中的各类需求。相比传统的模板脚手架体系,新型格栅组合模架具有装拆方便、绿色环保等优势,但因相关理论研究与工程实践还不足,其推广应用因此受到制约。为此,本文以该新型格栅组合模架为对象,对其受力性能进行较为系统的试验研究与理论分析,以促进其进一步发展与应用。可调支撑盘扣节点是新型格栅组合
学位
胡萝卜(Daucus carota L.var.sativa D C)为伞形科二年生草本植物,其肉质根中富含大量类胡萝卜素,丰富的类胡萝卜素赋予了胡萝卜绚丽多彩的颜色。本试验以不同生长时期橙红色胡萝卜为试验材料,通过对肉质根形态结构的动态观察、表皮色差指数分析,整体分析了胡萝卜根色的形成规律,鉴定出胡萝卜色泽转化的主要转折时期;利用靶向代谢组、转录组测序和荧光定量分析,初步揭示了橙红色胡萝卜表皮着
学位
黑星病是我国梨产区的重要病害之一,严重影响梨的优质丰产。作为植物信号传导中的第二信使,Ca2+在植物生长发育和响应逆境胁迫中发挥重要作用。钙依赖蛋白激酶(calcium-dependent protein kinases,CDPKs)是植物中广泛存在的一类丝氨酸/苏氨酸蛋白激酶,在钙信号传导过程中起关键作用,已有研究表明,CDPKs在抵抗病原菌侵染过程中起重要作用。目前,关于CDPKs在梨响应黑星
学位
为探明西葫芦幼苗生长的最佳灌溉方法,以西葫芦‘农园1号’为试验材料,设置以育苗基质(按体积比设计4个处理为泥炭︰珍珠岩=3︰1(CK),泥炭︰蛭石︰珍珠岩=3︰1︰1(T1),泥炭︰蛭石=2︰1(T2)和泥炭︰蛭石︰珍珠岩︰椰糠=2︰1︰1︰1(T3))、育苗穴盘(32孔(P1)、50孔(P2)、72孔(P3))、黄腐酸钾浓度(0mg·L-1(F1)、100 mg·L-1(F2)、300 mg·L
学位
设施黄瓜作为我国现代农业的一种重点应用蔬菜,深受现代人们的喜爱,设施黄瓜栽培由于温室小环境的限制,土地使用面积受限,病虫害逐年加重,由于大量施用氮钾肥,导致土壤中NH4+、K+含量逐年增加,土壤酸化严重,从而大大减少了设施黄瓜对钙的吸收,导致黄瓜出现生理性缺钙,缺钙症状有逐年增加的趋势,探索缓解低钙胁迫危害的方法对设施黄瓜栽培具有重要意义。解淀粉芽孢杆菌是一种生长在植物根际周围能促进植物生长的促生
学位
人工智能的发展需要依赖底层数据与技术,面对浩如烟海的结构化、半结构化、非结构化数据,如何将其高效存储并在不同场景下复现以精确支撑用户的使用需求,逐渐成为亟待解决的难题。为帮助用户从搜索意图出发,更加高效地达成搜索目标,满足信息多样化环境下不同形式数据泛化与知识的立体呈现。本文运用文献与实证研究方法,对知识图谱的定义、分类与架构进行整合,综述了知识图谱构建过程所涉及的关键技术,提出了知识图谱的5大全
期刊
近年来,鲜核桃因其具有独特口感和较高的营养价值而赢得广大消费者的青睐。但因鲜核桃青皮富含多酚,在脱青皮过程中往往因褐变导致皮肤被染成褐色甚至黑色,影响美观和人们的消费热情。因此,研究造成核桃青皮褐变的关键物质,解析这些物质的代谢规律,并筛选出轻度褐变或者不褐变的核桃新品种是亟待解决的问题。本试验以不易褐变染色的‘白水1号’、‘白水2号’以及普通核桃品种‘薄丰’、‘香玲’和‘金薄香8号’等10个核桃
学位