基于相似检测的电子数据审计方法研究与应用

来源 :南京审计大学 | 被引量 : 0次 | 上传用户:wuyi101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多个被审计数据源中可能含有相似的内容,这些相似内容在某些情况下也许会成为审计问题的突破口。例如,从不同来源采集到的两个被审计数据中,本不应当出现某些相似的内容,那么通过查找得到的相似数据就可以成为审计线索,而通过相似检测技术可以有效地发现这类数据。目前国内外对数据相似检测技术的研究多用来查找数据源中的相似重复数据,并对这类数据进行清理,从而提高数据的质量,而对于将该技术结合审计实践的研究与应用还比较少。本文首先搜集并阅读与选题相关的文献,包括审计信息化、相似检测技术和电子数据审计等方面,目的在于分析在电子数据审计中应用相似检测技术的意义和作用。接着,本文第二章介绍了开发相似检测系统所需的主要理论与技术,其中包括距离测度方法、中文分词方法和相似度算法。本文的第三章详细介绍了相似检测系统的三个主要功能模块。第一个模块为数据采集,负责将被审计单位的数据传递到服务器。第二个模块为数据库数据的相似检测,通过运用编辑距离算法计算字符型数据的相似度,实现了表内相似数据的查询和表间数据的相似项匹配。第三个模块是Word文档的相似检测,该模块主要实现了两个功能:第一个功能是对两个文档进行简单的相似检测,包括计算其相似度并显示相似内容,其中运用了中文分词方法和Jaccard相似度计算方法;第二个功能中建立了审计文档库,以便于审计组内的文档共享,并实现文库内容的关键词检索和文档匹配。为了检验相似检测系统中功能的实用性,本文第四章选取了审计署2016年对某省贯彻落实国家重大政策措施情况审计中的三个案例,分别应用于上述的三个功能:表间数据匹配、文档间相似检测和关键词检索。在案例中,本文将审计人员的工作方法与系统功能进行效果上和效率上的对比,从而验证了相似检测系统不仅可以提高审计人员的工作效率,也能够有助于审计工作中发现审计线索。最后,本文总结了该研究过程和结果中的创新点和不足之处,并提出了未来的研究方向。本文的研究在理论上实现了相似检测技术和电子数据审计方法的结合,丰富了运用计算机技术辅助审计工作的方法;在实践上有助于审计工作中高效地发现数据源中的相似重复内容,进而可能获得审计线索。
其他文献
本文是一项跨学科、综合性的研究,其内容涉及房地产经济学、经济地理学、土地经济学、城市科学、管理科学等多个学科的相关领域。本文查阅了大量国内外资料,比较、错鉴了发达国
陈染是当代文坛一位重要而独特的作家,她以强烈的女性意识得到了当代文坛的认可。她的小说创作十分独特,作品主题几乎从来不涉及国家以及民族题材,而是自觉疏离中心文化,以边
高时间分辨率是指获取高帧频光学图像的能力。成像器件的电荷读出速率、图像数据的传输与存储速率等硬件限制,是实现高帧频光电成像的技术瓶颈。同时,高帧频又与高空间分辨率
DNA甲基化是已知最早被发现的与基因抑制相关的表观遗传机制。DNA的甲基化修饰参与基因表达调控、胚胎发育、细胞分化、基因组印迹、X染色体灭活和细胞记忆等诸多重要生物学
动画产业已经成为文化产业发展中极具成长空间的产业之一。中国具有悠久的历史文化,面对当下文化产业发展进程,其自身的文化产业发展依旧需要不断成长,包括我国动画产业发展
放线菌能够产出抗生素、酶及其抑制剂等多类生物活性物质,且由放线菌产出的生物活性物质数量十分的惊人,目前生物界中发现的两万多种生物活性物质中,约有70%都是由放线菌产出
在新时期文学演化的历史中,与现代性衍进的思想文化线索并行的,还有传统文化因素的制约和影响。它们相互激荡、相生相克。本文侧重考察新时期小说中的传统性因素及其影响,试图对
区域经济差异与趋同是目前学术界的研究热点,但对于工业经济的差异与趋同研究却少涉及。文章从江苏省县域层面选取工业经济的相关指标,运用泰尔指数及β趋同检验对江苏省工业
<正>最新研究发现,中年男性如果常年大量饮酒,随着年龄越来越大,他们的心智可能衰退得更快。对大约5000名英国公务员实施的这项研究发现,通过测量推理等心智能力和大约6年间
期刊