【摘 要】
:
在如今这个大数据时期,人类如何从这些庞大的数据当中获取自身所需要的信息至关重要。因此,数据挖掘技术随之产生。关联规则作为数据挖掘技术的一个重要组成部分,其作用主要
论文部分内容阅读
在如今这个大数据时期,人类如何从这些庞大的数据当中获取自身所需要的信息至关重要。因此,数据挖掘技术随之产生。关联规则作为数据挖掘技术的一个重要组成部分,其作用主要在推荐系统方面,比如针对超市商品的摆放问题,通过分析大量的购物篮数据,挖掘什么物品经常一起被购买,然后将这些物品摆放在相同的位置,进而增加这些商品的销售。本文首先介绍了数据挖掘的相关技术,包含分类、聚类、离群点分析等。然后介绍了数据挖掘目前的一些经典算法、数据挖掘的基本流程以及数据挖掘算法的评估。在对关联规则挖掘算法的研究当中,本文首先讨论了Apriori算法,利用超市购物篮数据对该算法进行了实现。考虑到Apriori算法在性能方面所存在的一些缺陷。本文接着介绍了FP-growth算法,利用所生成的FP-tree,构造项的频繁模式基、条件FP-tree和频繁模式,进而发现对应的关联规则。并使用开发工具Python2.7对这两个算法进行了实现,然后将两个算法的挖掘结果进行对比。考虑到购物篮数据当中项集之间的相关性,本文用提升度来度量相关性,提出了负关联规则挖掘算法,并对该改进算法进行了验证,实验结果表明,这个算法可以有效地挖掘负关联规则。该算法考虑了在购买某些商品的前提下,哪些商品不会被购买。超市人员应尽量将它们摆放在不同的位置,从而为超市商品摆放问题提供了新思路。
其他文献
本文就英语中运用通感手法的几种途径进行了分析述评.
成语“守株待兔”源于《韩非子·五蠹》:“宋人有耕者,田中有株,兔走触株,折颈而死;因释其耒而守株,冀复得兔,兔不可复得,而身为宋国笑。”对于文中“株”的诠释,历来大都释
2009年7-10月我市甲型H1N1流感流行期间,笔者应用莲花清瘟胶囊与痰热清注射液联合治疗甲型H1N1流感36例,效果明显,现报告如下。
本文概括性地介绍了FloWorks软件,结合其傻瓜式“向导”功能以及“输入数据”和“结果”选项,使得普通的工程师可以轻松快捷地进行复杂的流体分析,并以一个传感器为例介绍其分析
目的建立测定人体血浆中头孢地尼浓度的UPLC-MS/MS方法,评价3种头孢地尼口服药物在健康人体内的生物等效性。方法随机、自身前后三交叉的试验设计。24名健康男性受试者单剂量
截止目前,长沙走马楼出土的吴简已经公布了三批竹简的释文,分别名为《长沙走马楼三国吴简·竹简[壹]》、《竹简[贰]》、《竹简[叁]》。①三批竹简中有大量户籍类简。释文公布
疳积疳积,是指小儿脾胃虚弱,运化失宜,以致气液耗损,饮食不为肌肤,外形干枯赢瘦,气血不荣,或腹部胀大,青筋暴露,形体虚惫,缠绵难愈,甚至严重影响生长发育,导致不良后果的一种慢性疾患。
引进了线性空间的极大子空间的概念,主要得出了3个结论:(1)线性空间V的子空间M是极大子空间当且仅当M是一维子空间的余子空间.(2)线性空间的任意子空间都可表示为一些极大子
【背景】肺动脉高压(pulmonary arterial hypertension,PAH)是一种多因素和进行性的恶性心血管疾病,其主要的临床特征性表现是肺血管阻力和肺动脉压力的增加,最终导致患者右心衰竭甚至死亡。研究表明,肺血管重构是PAH肺血管重构的重要病理生理机制。我们前期研究发现,真核翻译起始因子2α(eukaryotic initiation factor 2α,eIF2α)在与低氧诱导