基于深度学习的垂直领域知识图谱构建方法研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:ptcptsu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的发展,智能的信息服务持续升级,在各种智能信息服务领域均能看到知识图谱的应用,如智能问答、个性化推送、信息检索等。知识图谱帮助计算机学习人的语言交流方式,使计算机像人类一样“思考”,使得各种信息服务反馈给用户更加智能的答案。可以说知识图谱是传统行业和人工智能进行融合的方向,也是人工智能从研究走向落地应用的过程中必不可少的环节。垂直领域知识图谱是针对某个行业,根据该领域的数据来构建的知识图谱,相比于通用知识图谱,更强调知识的深度。虽然在通用领域,学术界和工业界都已经有大规模的标注数据可供知识图谱构建模型进行训练,并且实体和关系抽取技术已经取得了长足进步。但在垂直领域的场景下,存在着标注语料数据量不足,人工标注耗费钱力和精力等难题,并且随着业务的变更,实体和关系的类型会不断地更新,已有的标注数据无法应用在新的实体和关系类型上,这些难题使得在垂直领域构建知识图谱变得非常困难。为了解决垂直领域知识图谱构建困难和低效的问题,本文主要研究如何进行行业知识的抽取,并自动高效准确地构建垂直领域知识图谱。首先,为了构建用于进行知识抽取模型训练的增强数据集,本文提出基于词典和实例交叉的增强数据生成算法。其次,针对行业产品文档中的半结构化数据和非结构化数据,分别设计并实现了基于序列标注和子模式生成的表格知识抽取算法Bi-LSTM-CRF-SSG和基于BERT和概率图模型的联合实体关系抽取模型BERT-PGM。实验结果表明,经过后续容错处理,在测试数据集上,半结构化数据抽取算法能达到99.13%的抽取准确率,非结构化数据抽取算法能达到95.7%的抽取准确率。最后,本文实现了一个垂直领域知识图谱自动构建系统,并从功能和性能两个方面进行了系统测试,测试结果表明系统的功能和性能均满足用户需求。
其他文献
娄烨导演的电影《兰心大剧院》于2019年在威尼斯国际电影节上亮相并获得了主竞赛单元的金狮奖提名.暌违两年,该片于2021年10月15日在国内上映.电影根据虹影的小说《上海之死》改编,讲述了1941年发生在上海的一场谍战故事.“珍珠港事件”的前一周,为了套取日本海军密码专家古谷三郎的重要情报,中国女间谍于堇从香港返回了“孤岛”时期的上海并入住华懋饭店.于堇的公开身份则是知名女星,回上海表面上是接受旧爱谭呐的邀请,在他导演并主演的话剧《礼拜六小说》中担任女主角.
期刊
在西方文艺作品中,中国形象经历了从“极端美化”到“极端丑化”的嬗变过程,表征着西方对东方的“他者化”想象.这种想象一定程度上内化为华语电影在自塑中挥之不去的认知阴影,以及讨好海外市场的捷径.目前,华语电影在海外所建构的国家形象大抵分为四类:武林天地、玄幻境地、发展中的乡土、去不到的他乡.四种形象虽有部分代表性,但并非当前中国多元立体的社会真实.华语电影需在坚守民族文化特色的同时,融合世界共通情感,“直言”式地呈现当代中国形象.
交互纪录片的叙事是非线性的,这也就意味着其叙事不是基于时间,而是基于空间的.本文使用内容分析法研究交互纪录片的空间叙事,重点关注交互纪录片中的空间主题,文本层的素材使用与空间构图,时空体层的体裁形式以及空间模式的基本类型.本文揭示了交互纪录片空间叙事的特征:通过表征现实空间、空间塑形、互动参与来积极勾连现实,实现了对空间的深度重构;同时积极借用以往媒介形态,形成以时空体为核心的叙事逻辑.
电影创意是一切电影创作(制作)的起点与支点,其选择的对错优劣直接决定电影的成败高下.同时,电影创意又是电影创作(制作)的难点与奇点(物理学概念),涉及最原初、最玄妙和最自由的艺术想象与媒介创造.本文试图从创意思维、创意要素和创意模式三个方面来探讨电影创意的一些基本思路和实战应用,希望能为电影创作(制作)者和研究者提供有益的参照.
超现实主义运动的美学特征和表意习惯深刻地融合入大众美学体系之中.当代电影创意稀释了超现实主义对自动性、非叙事、无意义的坚持,集中强化了其原始冲动和梦境释放的高光.超现实主义在创意层面,注入观奇期待,成为剧本原始动力;在风格层面,注入叙事基调,成为作者话语标志;在文本层面,注入声画符号,成为影片表达能指.在处理和运用超现实主义元素时,需要认真处理它们“可否被感知、是否被惊奇、能否被认同”这三个递进问题.它们保持现实理性与超现实非理性之矛盾统一,保持“超我”塑造与“本我”驱动之矛盾统一,并完成从形式服务于内容
随着技术的变革,以电影为代表的艺术媒介信息被数字技术整合为感知的综合视听信息,这极大地改变了传统艺术信息的呈现方式,形成了全新的艺术与媒介之间的认知关系.数字信息传递作为数字时代人类感知方式变迁的重要表征,也经历了从物质性的媒质向信息化非物质媒介的变化.从弹框到界面,数字信息在电影艺术的传播介质发生变化;从字象到图像,数字信息逐步形成了独立的视觉表现系统,并且随着信息呈现系统的日趋完善,同时延伸了电影艺术的本体功能及其媒介内涵,也为电影艺术从稳定的视听艺术结构,指向了一条朝向虚拟现实/超文本链接/多媒态超
学科交叉和理论互鉴一直以来都为电影研究提供开阔的视域和多元的方法论,同时也会因边界的位移与模糊而产生不同程度的问题.当下新媒体的兴盛使传统的电影批评机制与新兴的话语批评现象互生共存,互联网、数字媒体催生出对传统电影理论的诸多挑战,故而电影理论的开拓和更多维度的跨学科理论研究亟需不断展开.在诸多纷杂的话语中,青年学者的学术思辨和研究成果亦聚集成声,所以,大学生电影节于2020年开办“国际青年学者论坛”,旨在为青年学者搭建分享学术成果、交流学术思想的平台.
期刊
本文旨在从电影银幕观的发展变化角度,从溯源画框论、窗户论、镜像论三种“前数字”时代的电影银幕观念,媒介融合语境下的电影银幕观念以及电影银幕与人类的身体关系演变三个部分考察“观众-银幕”之间的互动关系与身体关系,并以此重新思考电影本体.
伴随着触觉技术的不断发展和触觉媒介的广泛使用,触觉理论也成为了当代电影和媒介研究领域的新锐议题.其中,媒介考古学家大卫·帕里西和新媒体理论家马克·汉森分别从不同的哲学传统和身体理论出发,探讨了触觉媒介的具身性问题.帕里西受到福柯的影响,分析了触觉媒介作为一种身体技术如何导致了触觉感知的抽象化,启发我们思考媒介化触摸的离身化趋势和美学危机.汉森则继承了伯格森的传统,阐释了新媒体艺术基于情动身体的触觉美学,以及它如何在媒介融合的趋势中捍卫触觉的具身维度和审美救赎功能.本文认为,这两种触觉理论之间的对话和协商,
本文从劣质影像的生成与传播机制,对其概念进行了廓清.劣质影像的核心媒介特性:数字操控性、动态读写性、媒介自反性,呈现出光学电影影像到数字电影影像变革中的媒介断裂效应.而在后电影语境下,劣质影像以“拾得影像”的身份,被再度装配进“元电影”的叙事结构中,形成了“伪纪录片”“拼贴电影”“监控电影”“论文电影”“屏幕电影”等一系列基于电影媒介延展创意的后电影类型,表达了对数字影像的真实性、数字影像建构的媒介经验、数字影像的数据库组织逻辑的思考.