压缩UF-tree挖掘不确定数据频繁项

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:pgqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对UF-growth算法构造大量树节点和分支的局限性,且不断计算候选数据项支持度的不足,提出压缩UF-tree算法。压缩UF-tree算法改变建树条件:事务中数据项与树中某个分支节点的数据项匹配时,将该数据项合并到分支中;否则,从该分支节点创建新的分支,叶节点保存当前事务编号。构建单项数据项的概率向量,搜索树分支产生候选项,通过事务编号和概率向量计算候选数据项的支持度进而挖掘频繁项。通过实验对比与分析,压缩UF-tree算法可行且更高效。
其他文献
行政行为说明理由是指行政主体在作出行政行为时,对相对人或者利害关系人的权益产生不利影响的,除法律特别规定外,均应当向相对人或利害关系人说明作出该行政行为的事实因素,法律依据及裁量因素的考量。文中从说明理由的概念、范围、例外、方式、内容、要求等多个角度探讨了行政行为说明理由制度的完善路径,并穿插比较域外关于行政行为说明理由的规定,希望对我国的行政行为说明理由制度发展有所裨益。针对完善说明理由制度,行
建议和裁决的执行是WTO争端解决机制的重要组成部分,而且是实现世界贸易组织宗旨或目标的重要手段,而DSU所设置的合理期限制度则是促进建议和裁决执行的重要手段。确定合理期
针对基于约束得分的特征选择容易受成对约束的组成和基数影响的问题,提出了一种基于约束得分的动态集成选择算法(dynamic ensemble selection based on bagging constraint sco
在社会化媒体时代,关系成为营销的战略资源,企业实施关系营销包括:其一、以情感维系关系,其二、以渠道整合关系,其三,以数据转换关系。 In the era of social media, the re
期刊
由于初始簇中心的随机选择,K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题,提出了最大距离法选
期刊
深优9516是清华大学深圳研究生院用不育系深95A与恢复系R7116配组选育而成的感温型三系杂交稻组合,具有丰产性突出、米质优良、抗稻瘟病等特点,2010年4月通过广东省农作物品
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
资本管制作为一国摆脱由金融危机造成的困境的有效手段,因与金融自由化相悖,一直以来饱受争议,其正当性尚未被完全承认。国际投资保护条约大多是以金融自由化为原则制定,且更