基于随机分布理论的特征关联知识推理研究

被引量 : 0次 | 上传用户:kevin_0713
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联分析是指根据大量数据进行关联挖掘,发现隐藏在数据项之间有价值的相关关系。传统的关联分析主要是根据事务数据库进行多次扫描来挖掘数据间的规则。在数据量达到一定的时候,存在运算量过大,效率不高的情况。本文针对传统关联分析中的效率问题,结合概率论理论及数据先验知识特征,建立一种称之为“基于随机分布的关联规则算法”的运算法则来提高关联分析中的处理效率。主要研究内容如下:(1)本文利用中心极限定理理论,根据事务数据库中的数据先验知识特征,确定相应的随机分布与之对应。依据随机分布,对每一个项目集进行赋予对应的概率值,及建立与传统事务数据库所不同的项目集数据库。(2)本文提出基于随机分布的关联规则算法,提高关联分析中的运算效率。在新算法中,主要是针对项目集数据库进行挖掘处理。项目集数据库数据容量远低于事务数据库,新算法在挖掘过程可以降低运算量和减少耗时。在多种不同数据容量的情况下对频繁集和关联规则进行挖掘。分析新算法和传统算法,得出数据容量与新算法准确性之间的相关关系。(3)考虑到实际状况中的数据更新情况,本文建立基于随机分布的关联规则增量算法。对于事务数据和阈值变化两种情况,分别提出不同的增量算法来进行解决。而通过与传统算法进行对比,也证明了新增量算法在更新情况下可以保持高准确度及大大增加效率。本文利用MATLAB软件实现基于随机分布的关联规则算法和增量算法的改进。依据算法分析及样本数据的对比,证明了基于随机分布的关联规则算法在处理关联分析问题上的可行性及优越性。
其他文献
为贯彻落实习近平总书记在文艺工作座谈会上重要讲话精神,经中宣部批准,由中国文联、国家财政部、文化部共同主办,中国美协承办的“中华文明历史题材美术创作工程”(简称“历史画
复仇是人们基于天性和自然防卫的本能,为受到外来伤害的本人或亲属、同一氏族等进行的私力救济,寻求"以牙还牙、以眼还眼"的原始正义。随着社会的发展,在以儒家思想作为指导
李克强总理在3月15日的记者会上指出,民生本身就是天大的事,要做的事情很多。民营经济是我国创业就业的主要领域、技术创新的重要主体、民生改善的重要力量。加快发展社会事业,
报纸
基于证候诊断标准研究的重要性,文章首先从理论研究、临床应用和新药研发三方面对证候诊断标准的研究价值和意义进行了阐释。然后针对诊断标准研制过程中存在的如主证和主症
数据新闻在大数据时代逐渐受到新闻界的青睐,被认为是传统媒体数字化转型的一种趋势。本文采用文献研究、案例分析,研究数据新闻在国内外的发展现状、趋势及其发展困境,以期
岩画艺术作为一种最原始的艺术造型形态,承担着人们对于生活的热爱、精神的追求以及对未来的向往。岩画艺术作为人类最原始的思维活动所创造出来的产物,在此后的艺术发展中有
服务于初中生社会化的思想政治教育创新要回应他们社会化过程中的问题与需求以及挑战与困境。论文采取宏观研究与微观研究相结合、定量分析与定性分析相结合的研究方法,考察了
随着经济的迅速发展和城市的不断扩大,城市道路交通拥堵日益严峻,是迫切需要解决的问题,因而对城市道路交通控制技术的研究已经成为当前研究交通控制工程领域的一个热点。作为实
从商业广告中的道德缺失现象入手,分别论述了我国现阶段商业广告必须遵守的五个方面的底线伦理:商业广告必须遵守法律规范;商业广告必须真实可靠;商业广告必须讲求公平合理;
目的探讨原发性头痛临床诊治特点及发病机制。方法分析本病患者临床诊治资料,并对30例偏头痛相关神经肽和内分泌激素进行检测。结果偏头痛、紧张性头痛、丛集性头痛临床头痛