频繁加权概念格及天体光谱关联知识挖掘系统

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:joyceywq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
概念格是数据分析和知识提取的一种有效形式化工具,加权概念格是针对属性(项目)重要程度的不同,通过引入内涵权值而形成的一种格结构。频繁加权概念格是一种特殊的加权概念格,其所有结点都是频繁结点,即满足用户阈值的结点。本文对频繁加权概念格的代数系统、批处理构造算法以及加权关联规则挖掘原型系统进行了研究。主要研究工作如下:第一、构造了频繁加权概念格代数系统。首先,通过引入虚结点的概念,证明了频繁加权概念格是一个完全格;其次,通过定义频繁加权概念格上的上确界∨、下确界∧,构造了频繁加权概念格的代数系统,并证明了它的若干代数性质以及表示知识的完备性。第二、给出了一种基于频繁加权概念格的批处理构造算法。该算法利用加权概念结点的最大扩展性,自底向上逐层生成频繁结点和虚结点,以及对应的边关系,有效地降低了格结构的时空复杂性,提高了频繁加权概念格批处理构造效率;最后,采用UCI数据和恒星光谱数据,实验验证了算法的正确性和有效性。第三、在上述研究的基础上,给出了一种基于频繁加权概念格的加权关联规则提取算法AWRFWCL,并采用VC++ 2005和Oracle 9i为开发工具,设计并实现了基于频繁加权概念格的天体光谱关联规则挖掘原型系统。运行结果表明,该系统为实现天体光谱数据相关性分析提供了一种新途径。
其他文献
煤炭业作为国民经济的支柱产业,安全生产和保障矿工的生命安全是一个永恒的主题,井下员工的具体位置与分布情况等重要数据不能及时传到井上监控中心,是矿难事故频发而营救效
秘密共享是信息安全和密码学领域中的重要研究方向,能够有效地保障信息在保存、传输和使用过程中的安全性,克服了传统密码体制中权利过于集中而被滥用的缺点,提高了系统的安
协进化算法是近年来兴起的一种算法,它的发展时间虽然不长,但已经成功地应用到一些优化问题中,包括许多NP问题。它从传统的进化算法发展而来,而又有自己的特点:在协进化算法
信息在计算机系统中存在的形式——数据,越来越成为企业、单位和个人最重要的财富,它是决策的依据,是无形的资产,而且具有准确性高和传递性快等特点,大大的提高了工作效率和
概念格是一种有效的数据挖掘与知识发现工具,分类是数据挖掘中的重要研究内容之一。本文针对分类任务,从提高概念格的构造效率以及分类规则的分类效率角度出发,研究了面向分
海量信息的存在使得人们对搜索引擎提出了更加智能化和语义化的需求,如概念搜索、语义搜索引擎等。实现它们的前提是需要对文本进行更精确更深层的多类别标注和主题理解,这是
属性选择技术是数据挖掘中一个日趋重要的研究方向.基于互信息的属性选择算法是一种常见的属性选择技术,具有易用性和高效性的特点,且具有很强的理论基础,因此它是属性选择算
在形式语言与自动机的经典理论中,由于所选用的数学工具的局限性,造成了证明的繁杂性,降低了证明的可读性。本文利用半环方法来讨论有限自动机,半环方法通过有限自动机与半环
选播是Internet中一种新型的网络服务,是IPv6的新特性;它使用户通过一个选播地址就能访问到该地址所表示的一组服务器主机中对用户来说“最近”的一个。随着计算机网络技术的
随着生存环境的变化,人类精子的质量已正悄然下降,这导致的不孕不育症问题已日益严重。临床精液检查是评价男性生育能力的一个常规手段,而精子形态学检查又是精液检查的重要