面向税收条例的税法知识图谱构建方法研究

被引量 : 0次 | 上传用户:feileizuhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能、云计算及大数据等新兴技术的不断发展,税务作为国家经济的重要部分,面临着新时期税务改革和现代化建设等时代任务,智慧税务的建设在此背景下应运而生。但在实际税收征管中,需要专家对国家颁布的条例解读并制定规则,计算机人员将规则编写成代码进行税收计算。此种模式,严重依赖于人工的介入,无法实现智慧税务“智慧”的目标。税务领域迫切需要一种能自动抽取及表示税收条例中蕴含的规则和知识的方法。知识图谱的构建为上述问题提供了一种优秀的解决方案,通过知识图谱的构建自动表征和抽取税收条例中的规则及知识,用知识图谱“解读”税收条例,有助于税收条例到税收计算代码的自动转换,节约人力成本,对实现智慧征管具有一定意义。因此,本文结合自然语言处理处理技术,研究了面向税收条例的税法知识表示和税法知识抽取,构建了面向税收条例的税法知识图谱。具体研究内容分为如下三个部分:(1)税法知识表示:在构建税务条例知识图谱之前,需要对税收条例中的税法知识要素进行统计分析,根据条例之间的内在逻辑和对应关系,制定税法知识的表示方法。本文结合税法条例中规定的税法八大税法要素,提出一种面向税收条例的税法知识表示方法。该方法根据税法条例中内在知识逻辑结构将条例中的知识表示成一棵税法主题分面树。突出纳税主体、纳税对象、纳税行为和税种的语义角色和相互之间的语义依赖关系。再通过模块化结构对条例语义进行分装。以纳税人为源节点融合生成税法知识图谱。形成了税务知识的结构化语义表示方法,从而支撑后续税法知识抽取。(2)税法知识抽取:税法知识的自动抽取主要包括二个部分:税法知识要素抽取和要素关系识别。针对税法要素在税收条例存在的语义信息稀疏问题,本文通过MRC模型建模税收条例要素抽取任务。该模型利用机器阅读思想,构造问句为模型提供先验知识,为抽取任务增加语义信息,提升税法要素的识别性能。在税法要素的关系识别任务中,传统基于神经网络的关系抽取模型难以获取句子的结构特征。另外,由于句子本身仅包含少量的词,导致严重的特征稀疏,难以有效支撑税法知识要素之间的关系抽取。为此,本文提出了一种结合特征标记的税法要素关系抽取方法。该方法通过在税法条例中构造特征标记信息。利用BERT模型进行抽象特征提取,获取税务条例中的结构特征信息,构建税务条例相对于税务知识的高阶抽象语义表示。从而缓解税法要素关系识别中的特征稀疏问题,提高税法要素关系识别的性能。(3)税法知识图谱自动构建与验证:在要素和要素关系抽取研究基础上,本文结合税法知识内在的逻辑结构,提出了税法主题分面树的生成算法。通过与纳税主体源节点的链接,对抽取到的税法知识分面树进行拼接,形成税法知识图谱。为了验证本文提出来的知识图谱,设计实现了税法知识图谱可视化工具。目前,我们实现了1000+税法知识分面树的自动构建。并根据税法分面树的知识要素之间存在明确的规则性和逻辑性,通过自动编译的方式,将税法分面树转换为可执行代码,在仿真涉税交易数据上进行计算,实现税法分面树计算工具。通过和西安交通大学和税友软件集团股份有限公司进行合作,该系统目前已经部署并通过应用测试。
其他文献
我国是世界上当之无愧的制造大国,在全球范围内,“中国制造”占据三分之一以上的份额,制造业成为推动我国经济发展的重要基础。随着全球能源危机,经济发展缓慢趋于常态化,制造业在我国经济发展中的比重逐年下降。2021年我国制造业时隔多年终于实现正增长,制造业进入全新发展空间。随着全球市场竞争越发激烈,我国制造业企业在复杂多变的内外部环境下,面临较大冲击和挑战,急需转型创新发展,转变企业经营管理理念,优化内
<正>在我们应对激烈竞争、朝着建设国际一流现代金融企业目标奋斗的征程中,每个员工都应努力做一名执行力强的员工。执行力强的员工有先进的思想意识,有高尚的职业道德情操,有正确的世界观、人生观和价值观,有强烈的责任感、使命感和奉献精神,能做到以大局为重,
期刊
当前,随着人工智能等信息技术不断发展,高校图书馆应紧跟时代发展步伐,进行智慧化建设。智慧图书馆不仅是当前图书馆转型发展的要求,也是新时代我国教育发展的需要。文章阐述智慧图书馆的概念,分析高校图书馆智慧化建设的必要性,提出高校图书馆智慧化建设可以从理念创新、制度创新、空间改造以及人才更新四个方面进行路径探索,为我国高校图书馆进行智慧化建设提供参考。
<正> 聚四氟乙烯素称“塑料王”,具有高度的化学稳定性,工作温度范围在-180~+250℃,耐强酸、强碱、强氧化剂及有机溶剂,有非常好的润滑性和极低约静摩擦系数,对金属的摩擦系数为0.07~0.14,自摩擦系数接近冰,并且具有耐大气老化性能及表面不粘性。但是,聚四氟乙烯的压制工艺较麻烦,是采用冷压烧结法成型。坯料压制产生内应力,热稳定性较差。用它加工出来的零件装机后,由于工作温度的变化产生较大的收
期刊
非物质文化遗产是全球范围内各个国家各个民族杰出的历史传统文化,是人类口耳相传、代代传承的活态性的文化遗产。国家采取了大量相对应的政策用于保护与传承这些卓越的历史文化。非物质文化遗产博物馆为非遗的活态传承、传播与发展提供了空间载体。非物质文化遗产博物馆在对非遗保护与传承的过程中发挥了积极的作用,通过一些手段将这些杰出的历史传统文化以图文、音频、视频等形式保存下来,然而由于非遗中所具有的“非物质性”的
<正>皮革的物理机械强度不仅影响到皮革制品加工特性,也对皮革制品,如鞋帽、服装、家具等的使用特性有很大影响。皮革制品生产企业,尤其是军用鞋靴、汽车坐垫生产企业,在采购皮革时,往往都会将皮革的物理机械强度作为强制性的指标要求,可以说在多数情况下,皮革物理机械性能指标具有一票否决权。
期刊
近年来,新媒体的发展呈蓬勃之势,不仅开拓了图书馆的服务方式和内容,也加快了图书馆转型建设。文章论述了新媒体在高校图书馆的应用现状,梳理了高校新媒体服务存在的问题,提出“校内校外”的平台联动、“线上线下”的人才培养、“馆内馆外”的资源共享多维联动路径,以期为高校图书馆新媒体服务的进一步提升和发展提供参考。
新的信息技术的快速发展对教育尤其是高等教育产生了诸多重大影响,高校图书馆也在发展和转型,在此过程中,高校图书馆的建设从数字化到信息化,从信息化到智能化,又从智能化到智慧化,在每个演进的过程中,图书馆业务和服务都面临新的机遇和挑战。文章通过论述高校图书馆信息化进程的发展路径和演化过程,分析了高校图书馆从信息化到智慧化过程中业务自动化、业务流程改善、业务重组、管理模式转移等过程中面临的困境及其原因,通
“互联网+”环境引发了图书馆服务方式的变革。本文对江苏省独立学院图书馆智慧服务开展网络调查和问卷调查,对图书馆智慧服务开展的内容进行了调研,并对调研结果进行了分析。
国家民族精神离不开民俗文化,民族文化的传承和发展也和民俗文化息息相关。土族人民在长期的生产生活中,形成了很多习俗,并在代代相传中形成了自己特有的民俗文化。青海互助县是全国唯一的土族自治县,互助县土族的民俗文化具有典型性和代表性。而每一种文化都离不开相应的文化空间,文化空间为文化表现提供生存和发展的土壤。近年来,学界和业界不断强调文化空间对于传统村落的重要作用,但是在土族传统村落的保护和发展中,如何