高校资产数据挖掘的研究与实现

被引量 : 0次 | 上传用户:JACK910680
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术已经引起了信息产业界的广泛关注。进行高校资产数据挖掘与分析研究,有利于充分发现高校资产数据的潜在价值,能更好地为高校管理、高校决策提供科学依据。关联规则挖掘是数据挖掘的一个重要研究领域,是其中一个主要的研究方向,有着广泛的应用价值。它是指从大量事务记录中发现各个项集之间的相关联系,这些联系表示数据库或数据仓库中一组对象间某种关联的规则。过去人们已经提出了许多挖掘关联规则的算法及其变型,其中最著名的是Apriori算法。在关联规则挖掘中,频繁的I/O操作必定会影响关联规则的挖掘效率。减少I/O操作的方法主要是:减少扫描数据集的次数;降低需要计算支持度的候选项目集的数量,并使候选项目集的数量与频繁项目集的数量接近。在现有的关联规则挖掘算法中,广泛采用了“支持度—置信度”的评价标准。然而过去的一些应用发现,数据挖掘产生的大量规则,其中的大部分对用户来说可能是不感兴趣的或者没用的,甚至还可能引起误导。为了解决这个问题,本文提出了增加兴趣度阈值。当挖掘出一条关联规则时,只有其支持度、置信度和兴趣度同时都大于最小支持度、最小置信度和最小兴趣度阈值,才被认为是最有意义的模式。本文分析了高校资产数据资源的现状与特点,构建了高校资产数据仓库雪花模型,并采用部门约束对数据仓库的记录进行处理。在研究已有关联规则挖掘算法的基础上,针对经典Apriori算法对数据库的扫描次数过多、系统的I/O负载大和产生大量的无关中间项集等弊端,设计出了一个采用结构化查询语句(SQL)进行操作,并引入兴趣度作为评价标准的有效关联规则挖掘算法,利用该算法挖掘出了用户感兴趣的规则。该算法通过加入用户兴趣项,减少了候选项集的产生;打破传统算法的实现步骤,减少了数据库的扫描次数,降低了系统I/O负载;构建的用户兴趣度模型,增加了算法生成强关联规则的可读性,提高了算法的效率。实验表明,采用部门约束和改进的Apriori算法能有效地提高挖掘速度和效率,能更好地挖掘出高校资产管理指标之间的关联规则。最后对该数据挖掘模型进行了评价,提出的新增资产决策建议,在实际应用中取得了良好效果,提高了高校资产管理的科学性和实用性。
其他文献
目前农村中小学教师补充工作形势严峻,呈现出和以往不同的新任务、新要求,面临着新的机遇和挑战,如何有效补充农村中小学教师,尚有大量问题亟待研究和解决。通过对农村中小学教师
随着电子信息技术的发展,各种各样的电子设备发展日新月异,在电子设备不断升级换代的同时,对于电子设备中的电源也提出了新的要求,要求电源模块必须小型化、轻量化、以及高可靠性
东汉末而及三国,封建国家内部混乱、军阀割据,战争连年。在魏晋生产关系的变革、更新和民族关系的大变动中,无论在政治上,还是学术上,儒学的统治功能大大地削弱了,无法单独
期刊
【正】领导考评是官员选拔与管理的核心,绩效管理是一种崭新的管理模式,这两者既高度科学化、专业化,也高度理论化、技术化;既相对独立,又深度交叉在一起。目前两者正被引入
全球金融市场不断涌现银行并购热潮,但如何评价银行业并购绩效在业界和理论界长期存在争议。针对当前银行并购绩效评价角度和层面单一的问题,文章旨在构建出一个结合并购动机
为提高配电系统的可靠性、安全性、经济性,响应我国配电网智能化发展需求,针对我国配电网长期以来存在设备利用率低、供电可靠性低、线损率高等现状,在配电网运行时进行负荷预测
随着社会的进步,网络不仅是生活不可或缺的一部分,也在人们的决策活动中扮演着越来越重要的角色。以往有关社交网络的研究多集中于社交网络本身的特性研究其对消费者态度和行为
《驴得水》靠口碑发酵取得票房与话题双赢,多重主题解读空间造就其"讲个笑话,你可别哭"的观感。打着"开心麻花第二部电影"旗号,却让观众在喜剧中戳中痛点,在黑色幽默的外衣下
土家织锦作为一种地域性的民族民间传统手工艺,传承了上千年。当下,面对外来强势文化的冲击、区域经济结构的大力调整、乡民社会的剧烈变革、织锦传承人断代的困境,土家织锦
律师独立是指,为实现律师的功能,律师在执业活动中具有对各种法律事务独自依据事实和法律作出判断和采取行为而不受任何干涉和影响的职业特性。而律师独立表现为独立于国家、