数据的存储设计与挖掘

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:missyouangle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现在的时代是大数据和云计算的时代,数据的整理及其蕴含着的信息都变得越来越重要。数据的存储及数据间的关联规则挖掘方面都出现了较成熟的系统软件,但是一般都有这样或那样的缺点。本文通过对数据的存储和数据的挖掘两方面问题的研究,不仅建立了一种优化的小数据存储数据库,还改进了数据挖掘中的Apriori算法。文章的创新之处主要是以下两个部分:第一,数据库(Database)是建立在计算机存储设备上的仓库,其中数据的存储、管理和组织都是具有一定的数据结构规则的。SQL Server数据库语言是标准的计算机语言,其功能是实现对数据库的访问与处理;C#编程代码是一种面向事物的高级程序编程代码,运行于.NET Framework之上。通过对SQL Server数据库语言及C#编程语言进行系统的研究后,创新性的将SQL Server数据库语言与C#编程语言相结合,构造出了一个应用于统计数据的使用便捷的小型数据库系统。该系统的最大亮点是通用性,只要进行适当的修改即可通用于其他数据的存储。并且,通过一具体的实际案例,验证了该数据库系统的实用性。第二,Apriori算法虽然比较经典,但是其最大的缺点就是每次循环都要扫描一次事务数据库,运行时不仅占用空间大而且耗时长。通过系统的分析Apriori关联规则算法、矩阵关联规则算法与二进制关联规则算法后,去除糟粕取其精华,找到了一种完善Apriori算法的方式。该算法是一种基于频繁项目集矩阵的关联规则挖掘算法,它最大的特点是采用频繁项目集矩阵存储事务数据并且对其进行了简约处理,使该算法只要扫描事务数据库一次即可,不仅降低了存储空间还加快了运算时间。文章最后,不仅总结了该论文所做的工作,并且提出了进一步的研究方向。
其他文献
目的探讨内蒙古地区急性胰腺炎的病因构成,比较各自在性别、年龄、严重程度方面的临床特点。方法回顾分析2015年1月至2018年12月内蒙古地区6家大型医院收治的4168例急性胰腺炎患者的临床资料,按照致病因素将患者分为高脂血症性胰腺炎组、胆源性胰腺炎组、过度进食性胰腺炎组、酒精性胰腺炎组、特发性胰腺炎组和其他病因所致胰腺炎组。计算不同病因的构成比,并利用统计学方法对不同病因组患者年龄、性别及严重程度
视觉问答是一项具有挑战性的任务,其涉及对多模态信息输入(即图像内容和自然语言问题)的共同语义理解,以及基于视觉和语言的联合推理。现有的视觉问答模型通常结合了卷积神经
学位
在电力系统中,高压断路器起着控制和保护的作用,保证高压断路器的正常工作是一项极其关键的任务。随着人工智能技术的发展,机器学习和深度学习的算法逐渐被应用于断路器状态
自组装是群组机器人实现各种目标配置的有效途径,目前国内外已取得一定的研究成果。群组路径规划是群组机器人自组装实现的关键问题所在,直接影响自组装目标方案的适用性及自
学位
二维图像数据是人类获取信息最直观的形式,在医疗、交通、安全、智能设备上都有广泛的应用。因此,随着图像的维度持续增加,数据降维便成为计算机视觉领域的关键技术问题。在
传统的以电荷为存储媒介的存储器,随着工艺尺寸的缩小其面临着微缩极限的问题。因此研究新型的非易失性存储器是很有必要的。由于具有结构简单、便于集成和功耗低等优点,阻变存储器成为了下一代非易失性存储器的候选者之一。而其中以金属导电丝导电的导电桥阻变存储器(CBRAM),具有响应速度快、循环特性好和多值存储等特点,成为现今阻变存储器研究的热点之一。在神经形态计算和人工神经网络应用方面,理解和控制金属导电丝
得益于信息与数字技术,新兴媒体不断涌现。影响着传媒市场格局,冲击着以广播电视报刊为代表的传统媒体。加之国家对互联网信息产业发展建设日益关注重视,使传统媒体遭遇空前危机,粘性受众大量流失,尤其是年轻受众。危机下思而求变,各地方电视台,广播台,报刊杂志等传统媒体纷纷开始积极探索,寻求出路。以2011年我国开始实施推进三网融合工作为标志,媒体融合已经成为一种必然趋势,是传统媒体求生存谋发展的路线方针。媒
高中思想政治课承担着落实立德树人的根本任务,是培养德智体美劳全面发展的社会主义建设者和接班人的主阵地,新一轮基础教育的改革将培养学生学科“核心素养”作为改革的聚焦点。高中思想政治课程顺应新时代的要求,正历经以培养高中生学科核心素养为依据,从三维目标到核心素养为主线,深化课程内容的更新的改革之路。为了应对新的要求和挑战,提升高中思想政治课教师核心素养成为“核心素养”时代高中思想政治课教师专业发展的必
学位