基于遗传算法的分类规则挖掘研究

被引量 : 1次 | 上传用户:wenpeson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从大型数据库的数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息。分类规则挖掘则是通过对训练样本数据集的学习构造分类规则的过程,是数据挖掘、知识发现的一个重要方面。分类规则挖掘的实质是希望得到高准确性、易于理解的和有趣的分类规则。本文对遗传算法进行分类规则挖掘进行了研究,并在此基础上,进一步研究了基于小生境遗传算法挖掘易于理解的分类规则和基于自适应遗传算法发现有趣分类规则的技术。遗传算法是一种基于生物进化论和分子遗传学的全局随机搜索算法。本论文对应用遗传算法实现分类规则挖掘的关键技术进行了分析,包括个体编码、适应度函数的设计、遗传操作算子的设计等,从理论上阐述了基于遗传算法的分类规则挖掘的方法。在此基础上,为了从现有数据中挖掘易于理解的分类规则,本文提出了一种应用属性信息增益计算分类规则可理解性程度的方法,改进了以往方法中仅依靠规则的简单度来评价分类规则易于理解性的缺点,从而使得到的分类规则包含有更多的分类信息,更加有助于用户的理解。同时,为了克服普通遗传算法近亲繁殖、局部收敛的缺陷,本文在遗传算法的实现过程中应用了小生境技术。实验表明,这种分类算法切实可行、可操作性好、得到的结果易于理解。 目前在数据库中发现有趣分类规则仍是分类规则挖掘中一个具有挑战性的领域,本文提出了一种基于遗传算法发现有趣分类规则的方法。首先,通过使用属性信息增益和设置属性信息增益权值来构造度量分类规则有趣度的适应度函数,改进了以往算法中对于规则的有趣度的主、客观评测方法相分离的做法,使得对分类规则有趣度的评价实现了主、客观评测方法的统一。其次,为了防止进化过程过早收敛或降低收敛速度,本文讨论了应用自适应遗传算法实现有趣分类规则挖掘的方法。实验表明,这种分类方法能够发现数据库中的有趣规则。
其他文献
目的:了解宫颈液基细胞学检查(thinp rep cytologic test,TCT)与高危型人乳头瘤病毒(human papillomavirus,HPV)检测在宫颈癌早期筛查中癌前病变检出率的不同,探讨将两者联合
<正> Grassroots Research 妇联干部基层调研 RECENTLY, Peng Peiyun, President of the ACWF and all members of the ACWF’s Secretariat, dividing into nine teams, wen
期刊
本文研究了弱酸环境下的单晶硅片预清洗工艺、单晶硅片清洗的关键控制点,以及如何解决单晶硅片表面制绒不均匀问题。 In this paper, the pretreatment of single crystal w
运用文献资料、实地考察等研究方法,对国际国内大型体育场馆的文化展示体系进行分析和研究。借鉴国际一流体育场馆展示体系的先进经验,结合我国大型体育场馆文化建设与展示现状
门诊是医院的窗口,是患者与医院接触最多最广泛的场所。近年来患者对医院的不满感受大多数也来自于门诊就诊时。尤其对就诊过程中排队时间长,排队次数多意见最大。认为门诊效
社会和谐是中国特色社会主义的本质属性,构建社会主义和谐社会是我国现代化建设的重要目标,社会主义和谐社会是中国共产党领导全体人民共同建设、共同享有的和谐社会。这些方
研究了由分子量为400的聚环氧乙烷(PEO400)、碱金属盐(NaI、LiClO_4或LiBF_4)与环氧树脂或不饱和聚酯树脂形成的互穿聚合物网络(IPN)的离子电导率与温度的关系,发现其1olσ-1
【目的】为明确磷肥、钾肥用量和移栽密度对双季稻的施用效果,在田间试验条件下研究了不同磷肥用量、钾肥用量和移栽密度组合对江西双季稻产量、产量构成要素及磷肥和钾肥利