论文部分内容阅读
计算机网络技术在不断的发展,电子数据量以极快的速度飞速增长,数据量的增长速度如此之迅速,就给计算机业提出了一个全新的挑战。事实上,在浩如烟海的网络数据中,隐藏着巨大的有价值的不同用户所需要的信息,如果对这些网络电子信息进行有效的挖掘,并进行合理有效的利用,成为了计算机业一个重要的研究内容。在这种情况下,数据挖掘技术产生了,数据挖掘技术将采用计算机及相关学科的综合技术,并将这些技术广泛应用于这些海量数据查询中,让不同需求的用户使用数据挖掘技术,从海量电子数据中发现不同用户需要的、潜在的、有用的有价值的数据,这是数据挖掘的目标。多年来,经过多年国内外计算机工作者的共同努力,对数据挖掘技术的研究与应用内容不断的得到扩展,现已取得了很大的成果,现在人们已经结合了多种相关交叉学生,包括统计学、智能数据库、人工智能、机器学习、模式识别、专家系统等领域。但到目前为止,大多数数据挖掘的方法还不够尽善尽美,采用的方法主要是借用人工智能的各种方法,并用这些方法来挖掘数据中存在的知识,这种方法有很大的缺陷,主要是不能很好地理解数据中存在的知识。可扩展商业报告语言XBRL(eXtensible Business Reporting Language)的产生,有效解决了这一问题,XBRL是在可扩展标记语言XML(eXtensible Markup Language)基础上产生的,是一种计算机语言,主要应用于商业信息电子化交流,它主要应用于网络报告信息交换方面,其优点是为用户提供低成本、高效率的服务,同时为用户提供及时的、准确的商业信息,XBRL是目前在非结构化信息处理方面的最新技术,XBRL的产生,极大推动了数据挖掘技术的发展。论文对XBRL的数据挖掘系统模型进行了构造,此构造包括数据获取模块、XBRL隧道以及基于XBRL描述的知识库等内容;在文件系统中如何有效的存储XBRL数据,并将改变存储的数据的格式,将电子文件的方式保存为可以方便操作的XBRL格式,并利用系统软件进行妥善处理。论文将在研究现有XML工具的基础上,试图开发一个XBRL分析文档生成系统,该系统主要是根据所应用的XBRL分类标准,将在系统中存在的电子数据生成可方便操作的XBRL文档,该生成器严格按照国家规定的XBRL的分类标准,同时按照XBRL的技术规范进行总体设计,整体想法是将电子数据按照XML形式分成不同的类,在分类的基础上存入相关的数据链接库,再进行操作,该系统要具有封闭性即易操作性,即操作人员不需要了解太多的计算机知识,也不需要了解更多的XBRL相关知识和XML的专业知识,用户就可方便使用该系统。在本系统中,XBRL可以有效地为企业和个人等不同用户提供服务,这些服务包括XBRL规范文件的展示,同时还包括相关信息的查询及用户所需要的服务,这为企业和个人用户更好的数据挖掘提供了一种很有效的方法。