基于SQL Server构建数据挖掘解决方案的研究及应用

被引量 : 25次 | 上传用户:cxycsnf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DM是近年来信息产业界讨论和研究的一个热点,目前DM的研究大多集中在算法方面。大多数DM系统无法与数据存储的主要介质数据库无缝集成,同时由于数据挖掘标准语言的欠缺,使DM技术的应用范围仅仅限于领域专家。因此将DM与数据库紧密耦合及数据挖掘标准语言的开发,已经成为当前DM领域中新的研究热点。 本文就是在这样一个大背景下,结合上海市教委重点学科沪教委科(2001)71资助的中法合作项目“数据挖掘在GIS中的应用”,研究了基于SQL Server构建数据挖掘解决方案的方法以及DM技术在GIS中的应用。本文主要做了以下几个方面的工作: 第一,本文研究了OLE DB For DM和PMML两种标准DM语言,探讨了支持这两种标准语言的SQL Server的基本结构,在此基础上研究了基于SQL Server分析服务构建数据挖掘解决方案的方法,构造了相应的系统结构,给出了软件开发实例,利用OLE DB For DM中定义的DDL以及DSO分别从客户端和服务器端完成了DM模型的创建、训练和存储,达到了DM、数据库和应用程序一体化的目标。 第二,本文研究了将自主开发的DM算法外挂于SQL Server构建数据挖掘解决方案的方法,构造了系统结构,给出了软件开发实例。 第三,本文重点研究了如何在SQL Server中集成自主开发的DM算法,给出了整体实现框架,并在VC++7.0下实现了DM算法的集成,将DM算法与SQL Server数据库无缝集成到了一起,使得DM算法符合OLE DB For DM,利用该算法构建了DM模型,做出了预测查询。 第四,本文研究了DM在GIS中的应用,探讨了DM与GIS的集成,提出了一种DM与GIS集成的结构,构造了智能航线设计系统,将自主开发的复合聚类分析算法以模块形式外挂于SQL Server的方式应用到了智能航线设计系统中,完成了航线设计,同时本文还基于SQL Server分析服务构建了GIS数据挖掘解决方案,创建了GIS数据挖掘模型,并将该模型以PMML标准形式存储,给出了详细的船舶分布统计信息。 第五,本文比较了三种基于SQL Server构建数据挖掘解决方案的优缺点,得出了理想的构建数据挖掘解决方案的方法,为数据挖掘的广泛应用提供了一条新的思路,同时对利用复合聚类分析算法和微软聚类算法设计的航线进行了分析比较。
其他文献
环境是人类赖以生存的必要条件,环境的优劣直接影响人类的生存质量。文章阐述三股流水库工程建设对环境的影响,并进行了综合评价。
如果对长沙马王堆出土古笛复制实验,就会发现:该乐器发音灵敏、音质优美、调音方式独特,背孔功用特殊,属于音乐性能极高的实用乐器,这对进一步研究古乐器有重要意义。
拉康的学说越来越多地被世人所关注,成为二十世纪末期不止一种理论流派的源流和支柱。美国学者认为拉康是弗洛伊德之后最有影响和褒贬不一的精神分析学者。苏联学者也承认,拉康
随着人类进步的脚步加快,人的物质生活越来越丰富。对于产品的要求也不仅仅停留在对物的基本功能的需求上,而上升到一种心理精神等附加价值的提取上。同时,在后现代主义的影响下
二十世纪,是中国妇女大解放的世纪,也是女性文学崛起的世纪。20世纪的著名女作家张爱玲留下大量作品,也为人留下许多谜.她生于二十年代,四十年代崛起成名,在九十年代的文坛再掀波澜
<正> 农历十二月初八日,俗称“腊八”,是佛陀成道纪念日。据北传佛传记载,这一天释迦牟尼佛在菩提树下,夜见明星,豁然开悟而成正觉。我国南北大小寺庙与佛教团体都要在这一天
目的:探讨磁共振SWI相位值及T2*值定量评估慢性乙型肝炎患者肝铁沉积的可行性,分析SWI相位值与T2*值的相关性,为慢性乙型肝炎患者肝铁沉积的定量评估寻找合适的方法。材料与方法
目的与内容:从全国范围看,近年公共事业管理专业毕业生就业率呈现下降趋势,这是由多种原因造成:其中供给增长过快,结构存在问题,个体差异小,竞争激烈是主要原因。能否提前进行应对相
目的: 按照GCP原则实行规范化临床试验,即分证、分阶段、分期、分病原论治,探讨小儿肺炎的中医证候演变规律,评价规范化中医综合防治方案的疗效。 方法: 1、按照GCP原则
到2004年,中国加入WTO已经有两年多的时间了,“入世”对于我国国民经济运行的深层次影响已经逐渐表现出来,航运业作为我国的一个基础性产业也不能例外。这种影响表现在我国航运