【摘 要】
:
在重视和保护少数民族文化遗产的今天,人工智能和大数据的发展为我国少数民族文化遗产的传承和保护提供了有利条件。唐卡是一种具有藏族文化特色的绘画艺术形式,也叫热贡艺术,具有艺术价值、历史价值、美学价值等多种价值。由于唐卡资源种类多数量大和互联网上有关的唐卡数据的多源异构性,所以如何在繁杂的数据中对唐卡领域文献进行文本内的知识挖掘及对有关的唐卡知识进行搜索,并以可视化方式呈现唐卡知识之间关联关系,满足用
论文部分内容阅读
在重视和保护少数民族文化遗产的今天,人工智能和大数据的发展为我国少数民族文化遗产的传承和保护提供了有利条件。唐卡是一种具有藏族文化特色的绘画艺术形式,也叫热贡艺术,具有艺术价值、历史价值、美学价值等多种价值。由于唐卡资源种类多数量大和互联网上有关的唐卡数据的多源异构性,所以如何在繁杂的数据中对唐卡领域文献进行文本内的知识挖掘及对有关的唐卡知识进行搜索,并以可视化方式呈现唐卡知识之间关联关系,满足用户的快速查找唐卡知识的需求都是非常重要的。针对这些问题,通过对唐卡知识图谱建设的研究,实现唐卡数据的有效组织,为唐卡领域知识图谱建设提供基础支撑,促进智能问答、语义分割、语义搜索。本文在深入研究知识图谱的基础上,探讨了热贡艺术知识图谱的构建,并系统分析了领域知识图谱构建的相关理论及其技术,以唐卡领域知识图谱为研究对象,从命名实体的关键技术入手,继续探讨构建唐卡知识图谱的相关技术及相关方面的理论,力图使唐卡知识图谱以可视化形式呈现。本文的主要工作如下:首先,以热贡艺术领域的知识图谱平台为例,对热贡艺术知识中的实体表示进行识别、命名和抽取。主要工作流程:针对采集和收集到的唐卡数据,构造了有关唐卡的词典,然后针对该词典运用了前向最大匹配算法,构建完成了唐卡领域语料库,并能大幅度减少标注过程中的产生的人工成本。为后续基于热贡艺术属性描述文本的命名实体识别方法打下了基础,并在深度学习的基础上,提出了基于深度学习方法的BBC-T(BERT-BiLSTM-CRF in Tonka texts,BBC-T)模型命名实体识别方法。该模型可以有效地识别有关唐卡的制作工艺、工艺材质、绘画流派、唐卡的题材等实体,F1分数分别为99.97%、96.85%、91.158%、96.61%,高于隐马尔可夫模型(Hiden Markov Model,HMM)、条件随机场模型(Conditional Random Field,CRF)、双向长短期记忆-条件随机场模型(Bi-directional Long Short-Term Memory,Bi LSTM)等模型的相应值,也为相关研究提供了参考。实验结果表明,所提模型对命名实体识别的综合效果得到有效提升,F1值均优于对比模型。此外,开发有效的、准确的唐卡命名实体识别系统,有助于构建唐卡领域的知识图谱。其次,根据唐卡文本的实际需求,采用了正向最大匹配算法对唐卡文本进行了分词,因为对唐卡文本分词的准确性会直接影响了紧随其后的唐卡文本中词性标注、词向量表示和唐卡文本分析的质量。然后,针对不同的唐卡数据组织形式,采取了不同的手段获取唐卡知识。在此基础上,为了实现唐卡数据的有效组织和表示,将唐卡知识图谱中的实体和关系训练为向量表示,并将其训练结果的向量表示保存为两个文本文件,并使用基于资源描述框架(Resource Description Framework,RDF)三元组和属性图模型的唐卡领域知识图谱的知识结构和数据关联,以及唐卡领域数据资源化的统一建模、存储。最后,将构建完成的唐卡知识图谱进行了可视化。通过知识抽取和表示的三元组数据存储在Neo4j图数据库中进行可视化展示,组织了大量复杂和碎片化的数据,并利用节点、边缘和属性等数据的结构来管理唐卡领域的知识图谱。此外,我们可以使用Neo4j本身来定义和实现图形数据查询语言Cypher来查找唐卡某个特定方面的实体及其关系,并将后者形式化。这样,我们可以一目了然地看到,我们正在寻找有关唐卡某一方面的实体信息。
其他文献
在二十世纪末,岩彩绘画重新登上中国艺术的舞台,关于岩彩的材质解释,教学类的相关书籍已经很丰富,但是关于岩彩的技艺方式在我国文艺行业的发展还并没有达到一定的水平,可突破的创新发展还是很丰富的,它在继承传统文化的基础上还融合了更多的创新内涵,岩彩具有深厚的色彩视觉感受,具有丰富的材质,颜色,媒介的技法展示,这种丰富多彩的展示是任何画种也无法比拟的,正是这种绚烂缤纷的包容,带给了岩彩装饰绘画无限创新的可
近年来,中国经济持续发展、商标的作用逐渐凸显,而频发的商标侵权行为也亟需法律规制。2013年我国《商标法》首次引入商标侵权惩罚性赔偿制度,2019年将制度中的惩罚倍数由一至三倍更改为一至五倍。但是该制度在司法实践中的适用频率却一直较低,这个问题的出现正说明了该制度的司法适用应当继续完善。本文除绪论和结语之外主要分为四个部分,第一部分首先从制度本身出发,阐释了制度应当归属于民事责任范畴,与经济法责任
隐喻又被称为暗喻,它是用一种事物暗喻另一种事物。在绘画中隐喻就是艺术家运用隐喻的思维方法进行艺术创造的过程,也是艺术意象形成的过程,更是艺术家生命体验的表现过程。拉斯·艾琳是挪威当代最具代表性的艺术家之一,特殊的成长和生活经历使他的作品在日常的现代图像中呈现出深刻的精神内涵,他秉承具象与抽象之间创造了一套跨越绘画、摄影和电影表现界限的绘画形式,其艺术创作本身也是艺术家进行隐喻与诠释的过程。对拉斯·
近年来随着网络信息技术的进步,特别是大数据、5G技术的发展,给我们的日常生活带来了许多便利,人们的社会活动方式由“线下”逐步走向“线上”。电子数据作为证据在民事诉讼中的使用频率越来越高,给民事证据制度的发展带来了新的机遇和挑战。司法实践中,电子证据在证据收集、证据保全和证据认定三个环节容易出现适用难题。为此,需着眼于电子证据的自身特性,确立完善的民事电子证据司法适用体系,以使其发挥出应有的证明作用
昂拉八庄在青海安多地区被称之为“安多昂拉((?))”,具有特殊的历史地位和重要地缘政治影响。该社区的形成和发展与中国社会历史发展和变迁的大背景紧密相连,而且与周边族群的历史活动紧密的相连,在青海安多社会历史和文化记忆中成为了尖扎地区的最具象征性的传统社区文化单元。青海安多藏族社会中,尖扎地区昂拉八庄展现了独特的社区结构和文化秩序。因此,笔者将昂拉八庄作为田野点,以人类学理论视角进行长期的实地调查,
<正>一、前言随着信息技术的快速发展,城市管理人员将先进的大数据技术融入到城市社区建设中,透过适宜的大数据平台来完善城市内部的多项功能,利用城市居民各项观念的改善来提升治理效果,解决现实生活中存有的各项治理问题,有效改善城市治理水平。二、大数据环境中城市智慧社区的主要特征一方面,大数据环境下的城市智慧社区包含一定的功能性。一般来讲,相较于传统社区,城市智慧社区带有合适的环境敏锐度与适应性,
养老产业是促进海南经济发展的重要产业。本次调查结果发现,目前海南民营养老机构与医疗服务系统合作较少,“互联网+”智能养老服务开展较少,养老服务人才专业队伍结构匹配不均衡,学历结构不合理且层次较低等问题较为突出。为推进海南自贸港供给侧结构性改革,针对养老产业发展过程中存在的问题提出对策建议。
桑桐先生,作为我国十分有影响力的音乐家,在作曲、音乐教育领域中取得了非常大的成就,对于我国音乐事业的发展有着很大的贡献。他将西方传统大小调体系与中国民族调式融为一体,运用民族五声调式与钢琴独有的表现形式来体现作品中的内涵,他在音乐创作中着重于寻找民族风格,创编出许多中国钢琴作品。在钢琴发展的历史中,桑桐先生把中国传统民族音乐进一步地推向世界,其代表作是《内蒙古民歌主题小曲七首》。通过对该组曲的研究
幸福是人类社会不懈追求的最终价值目标。究竟什么是幸福?又要怎么去实现这个愿景?对于这个问题的看法千人千面。纵观历史车轮前进的道路,幸福的定义不胜枚举,每个人对幸福的认识和向往各不相同。在传统哲学的理解视野之下,人的幸福要么是纯粹的物质生活,要么是抽象的精神生活,更甚于将幸福寄托于虚无的另一种世界中,这都造成了人类对幸福认识的片面化。马克思以历史唯物主义为基础,推翻了传统哲学关于幸福概念的片面影响和
以城市生活垃圾焚烧飞灰为研究对象,利用飞灰替代石灰,制备石硫合剂,为飞灰资源化利用寻找新途径。通过比对试验,确定了利用飞灰制备石硫合剂的技术可行性,通过不同质量比、不同反应时间确定最佳试验条件,并通过与市售石硫合剂有效成分、重金属含量等比较,确定了自制石硫合剂的品质和农药应用安全性。结果表明:以城市生活垃圾焚烧飞灰为原料,制备石硫合剂技术可行,得到红褐色透明液体,波美度在20以上,主要成分为多硫化