面向XBRL领域本体的语义基元提取方法

来源 :暨南大学 | 被引量 : 0次 | 上传用户:lostcity_online
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XBRL(可扩展商业报告语言)已被运用在越来越多的国家和组织中,尽管已经取得了一定范围内的成功,但是其应用和发展也遇到了瓶颈:一方面,目前XBRL领域还没有一种专业的概念体系指导标记的运用;另一方面,XBRL财务报告中概念的语义性较弱,影响了其制作和数据共享。因而,为增强计算机对XBRL财务信息的可读性,需要一组财务报告的语义基元用于说明XBRL概念体系。本文综合运用语义基元、图论、领域本体等科学理论作为研究基础。首先,通过梳理相关文献分析语义基元提取方法的研究现状与不足;其次,确定以图论的角度构建会计术语关系网络图,利用会计词典并引入Page Rank算法,然而原始的Page Rank算法并没有考虑到文本领域特性,因此本文在对原始算法模型的基础上,针对财务报告和元素清单的文本特征,提出改进Page Rank算法即PRFR算法实现对语义基元的提取;然后,以基于词频和TF-IDF为基准的定性实验对比分析本模型的优越性,再通过盲选实验定量评估本模型的有效性;最后基于提取出的语义基元完成对元素清单和财务报告知识的表达和验证。本文的创新点如下:(1)本文分析了财务报告和元素清单的用语特征,并总结出元素清单中术语的结构特点。首先,本文结合定性与定量方法,阐述了财务报告在结构和用语层面的特征;接着,以元素清单为核心语料,通过人工划分,得出元素清单中术语的结构规律性,其中包含以核心词为主要的信息承担部分,附加修饰成分用以表达术语的相关属性,这一结构特点对语义基元的提取提供指导和依据。(2)本文兼顾了语义基元提取的全面性与规模性。首先,本文通过构建会计词典有向图,分析出每一个节点仅存在“是/否在环路上”两种情况,因此对于在环路上的点利用PRFR值进行提取,若不在环路上则选择出度为0的点,以保证语义基元提取的全面性和科学性;此外,本文对初步提取出的语义基元基于同义词林予以合并,较大程度的保证了语义基元的表达效率,旨在实现以最小的语义基元规模表示最大的领域知识范围。本文从语义性角度来对XBRL财务报告中语义基元的提取予以规范,该问题的解决能促使计算机更好地理解XBRL财务报告,将推进XBRL的应用更上一个层次。
其他文献
我国从20世纪90年代起开始引入政府绩效管理。政府绩效管理作为行政管理的有效工具,对于政府部门及国家工作人员的规范化管理、持续推动机关作风的转变和效能的提升具有重要作用。税务部门对于绩效管理工作的重要性非常清楚,在日常管理中,绩效管理一直是不可或缺的一个环节。本文根据新公共管理、委托—代理理论,以及关键绩效指标法、平衡记分卡法等政府绩效管理的方法,采用文献法以及实地调研法等方法,对税务系统绩效管理
作为市场活动的主要参与者,企业是市场经济中最重要的市场主体,而其中,中小企业占据了绝大部分,中小企业在稳定增长、调整结构、扩大内需等方面发挥着不可或缺的作用,其发展程度很大程度上决定了现代化经济体系的水平。但由于我国市场经济体制还不够完善,市场在资源配置中起决定性作用发挥还不够充分,加之在经济下行压力和新冠肺炎疫情的影响下,中小企业受到自身发展阶段和能力条件的限制,做好中小企业服务工作成为地方政府
本文研究的是一种多水下无人航行器编队队形动态重构方法,水下无人航行器(Unmanned Underwater Vehicle,UUV)是一种拥有较强自主能力的水下无人作业装置,在民用领域中,可以用来进行海洋资源探索、海底地形勘测、海洋搜寻救援等多种任务;在军用领域中,可以代替载人潜器进行侦查、搜寻甚至攻击等任务。随着时代的发展和相关技术的进步,现代海洋探索任务越来越复杂,只依靠单个UUV来完成相关
隐喻在日常生活中随处可见,认知语言学研究表明隐喻还是一种重要的认知方式。随着人工智能话题的不断升温,自然语言处理研究也成为学术界和工业界共同关注的热点领域。而隐喻的计算化研究正逐步吸引自然语言处理领域学者们的关注,它也是自然语言处理研究中不可回避的重要问题。近些年来,深度学习方法发展迅速,深度神经网络在特征学习上具有明显优势,鉴于此,本文主要是基于深度学习的方法对隐喻识别和理解问题进行研究。首先,
近年来,交通拥堵问题愈发严重,为减少交通拥堵带来的经济损失及社会影响,利用智能交通系统(ITS)管理和改善交通是十分必要的。交通流量预测是ITS的基础,它通过分析历史交通数据预测未来的交通状况。准确、实时的交通流量预测不仅为相关部门的管理提供了科学依据,而且提高了公共出行的效率和安全性。交通流量数据具有复杂的时空依赖性,这对于其准确的预测具有挑战性。目前,大多数方法都是基于交通流时间序列特征信息进
本课题以研究龙胜地区的红瑶少数民族的博物馆文化创意产品的设计为主要内容。从国内外的博物馆文创产品的开发现状与发展过程中所面临的问题入手,论述地方博物馆民族文创产品开发的重要性。国内外很多博物馆也都越发注重文创产品的开发设计,一些知名度较大的博物馆已开始着重打造自身的IP形象。而我国的博物馆文创事业起步稍晚,与国外的博物馆文创产业还是有一定差距。我国少数民族众多,文化资源丰富。地方博物馆作为当地历史
近年来,随着社会的发展,半导体器件在各行各业都起到了重要的作用,然而,传统的Si基器件受其材料性能极限限制已逐渐不能满足人们的需求,目前越来越多的研究在于开发替代材料来进一步提高器件的性能。其中,Ga N材料由于其具有高电子迁移率、高击穿场强、高工作温度等方面优越的材料性能,成为了研究热点之一。Ga N基器件在许多发达国家都被列入了重要的战略研究计划,其市场占有量增长迅猛,未来发展无可估量。相对于
哺乳动物早期胚胎发育是一个十分复杂的生物学过程,该过程包括卵母细胞受精直至发育到囊胚的整个阶段。随着科学和医学领域的发展,哺乳动物早期胚胎发育过程也逐渐成为了众多科研工作者们关注的焦点,哺乳动物早期胚胎发育机制的研究对医学领域中辅助生殖的发展具有良好的推动作用。猪在免疫学和生理学上与人类相似,早期胚胎发育机制也和人类相似,所以猪早期胚胎发育机制的研究对医学及农业发展具有重要意义。近年来,长非编码R
新形势下企业面临的竞争环境错综复杂,制约我国众多企业营业利润提升和经营管理效率改善的深层次问题依然突出,其中资本结构被认为是有效改善企业营业利润和管理效率的有效途
随着web2.0时代的到来,社交媒体开始在社会生活中流行开来。作为社交媒体的一种,微博依靠其巨大的用户基数和强大的用户粘性成为了当下社会的重要信息源。巨大的用户基数和快速的信息传播速度使得微博平台的谣言能够对公共安全构成极大的潜在危害。适应微博平台的特异性,探究出针对微博平台的谣言检测方法具有重要的现实意义。为了实现微博平台的谣言自动检测,大量的谣言检测方法被提出。已有的谣言检测方法主要分为基于特