基于孤立点的数据挖掘研究及其在税务决策系统中的应用

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:lfwvb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在分析税收业务和现有税务管理信息系统的基础上,结合对孤立点数据挖掘技术的研究,提出了建立基于孤立点数据挖掘对纳税人行为的分析系统。基于此,本文论述了孤立点数据挖掘的研究发展状况,指出了基于单元的孤立点挖掘算法存在的缺点,并予以改进;其次,在熟悉税务业务的基础上,根据系统需要,设计并实现了一个完整的孤立点数据挖掘的数据准备过程;最后,使其改进的算法应用到对纳税人行为的分析中,从而更加完善了我们与泰安国税局合作的项目《泰安市国税局数据仓库与数据挖掘系统》。 总结本文的研究内容,主要有如下创新: 1、在基于单元的孤立点数据挖掘算法基础上,针对边界单元格出现的孤立点误判问题,给出了对M值进行动态调整函数。 2、对算法中D的应用提出了区域取值,以使用户能更好地把握衡量问题的度。 3、在以上两点基础上给出了对原算法的改进算法,并达到了较好的效果。 4、在基于孤立点数据挖掘的数据准备中建立了数据仓库,并提出基于时间戳的数据增量更新方法,该方法很好地解决了在数据仓库中对海量数据进行数据更新的问题。 另外,本文通过实例,对改进的算法进行了验证,结果证明新旧两种算法具有相同的时间复杂度,但新算法在避免边界单元格处孤立点误判问题上达到了明显的效果。
其他文献
本文在系统的野外地质调研及专题性的矿物学填图基础上,对皖南天井山金矿进行了矿物学研究,旨在探讨矿床的成矿作用,为找矿提供依据。
未来儿童卫生服务的发展方向西安医科大学第一临床医学院妇幼系(西安710061)潘建平目前正值新旧世纪交替之际。伴随全球政治、经济格局的变化和国内政治、经济体制改革的深入,国家医疗
沟通,在日常生活中的重要性不言而喻,有很多人会因沟通不畅而苦恼。$$前几天,就遇到件很奇怪的事:一位朋友告诉我,某人认为你怎么怎么的。其实,这人是我很尊敬的人。沟通不畅造成的
报纸
四川西部乡城—稻城—得荣地区位于我国西南三江中北段义敦—中甸岛弧带有色、贵金属矿产集中区南部。自印支期以来,研究区先后经历了俯冲造山、碰撞造山及陆内汇聚造山等构
BackgroundAlthough 微粒物质,与直径 &#x0003c;2.5 &#x000b5; m (下午 <sub>2.5</sub>) 和 &#x0003c; 10 &#x000b5 ; m (下午<sub>10</sub>),和另外的污染物质与心血管的病态和
泰安是板栗的主要产区之一,以盛产“泰山明栗”而闻名全国,据2003年统计,全市栽培总面积18667hm~2,年产量26000t。自20世纪70年代实施良种化栽培以来,已选育和引进石丰、烟泉
中国动画曾经在动画史上取得了辉煌的成就,但是,进入20世纪90年代以后,中国动画事业却不尽人意。随着外国的动漫势力的入侵,占据了中国大部分的动画市场,我们现在耳熟能详的
随着计算机技术的发展,借助于工程软件,对化工过程进行设计型和操作型计算与优化,已成为当前化学工程领域中研究的热点问题之一。本文基于Excel、AutoCAD 和PhotoShop 等软件
在世界贸易自由化的发展进程中,随着传统贸易壁垒的逐步弱化,绿色贸易壁垒正在迅速成为一种新的非关税贸易壁垒。通过分析绿色贸易壁成的原因及中国服装行业的现状,提出采用"