基于序列前缀技术的XML频繁路径挖掘算法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:mxhcxp11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML文档是半结构化数据,对其进行频繁路径挖掘可以分为两步:XML文档序列化和序列挖掘阶段.现有的序列化方式将XML文档表示为Xpath路径集合,其中有大量的节点冗余;序列挖掘阶段采用的类Apriori算法需要多次扫描数据库并产生大量的候选集,采用的Prefix Span算法会产生大量的投影数据库,占用较大的内存.针对以往XML频繁路径挖掘算法存在的不足,本文提出一种高效的挖掘算法——基于序列前缀技术的XML频繁路径挖掘算法(PXFP,Prefix-based XML Frequent Path Mini
其他文献
阐述了保密强度的量度-工作因子、计算复杂度、时间资源、概率,并提出了一种实用的保密算法,着重对该算法进行了保密强度分析,即工作因子分析、计算复杂度分析、时间资源分析、概
在都市里住久了,许多感觉逐渐迟钝、麻木了,只有从街上行人衣着的增减和商场里换季减价的广告上得知季节轮换。所幸早先在乡间的记忆还没有像清晨的露珠被太阳一照就消失殆尽
在空拉黄铜管工艺实验的基础上,探讨了空拉变形工艺对残余应力和壁原变化规律的影响.实验结果表明,空位管具有较大的残余应力;空技拔时的道次加工率,加工道次和对模拉伸时所用衬模
针对供热管网的无沟直埋敷设方式,根据管道材料承载应力的能力及土壤与管道保护外壳之间的磨擦力对管道所产生的约束,按照弹性分析方法,通过对管道承受的应力及其在土壤中的受力
北疆。北疆是什么地方?是祖国的北方边疆,那里有我们最可爱的战士,在月夜,在北疆哨卡,就像无名的小草驻扎在边疆的土地,像地图上最北边的图钉,坚定地钉着安宁。这就是郭忱的《月夜
<正> 湖北省武穴市房地产管理局联系实际从社会关注的焦点问题入手,从群众反映的热点问题查起,采取切实有效措施,使房地产服务的“窗口”更加洁净明亮,取得了成效。 在加强行
子叶的小小说《忙出了问题》,题目很口语化很平民化,但看似不起眼的这个题目中,却巧妙地设置了一个悬念:忙出了什么问题?——是忙中出错.还是因忙而忘了更重要之事,抑或忙出了心脏
分析了铝电解生产中添加锂盐对电解槽和电解系列的综合影响,提出了添加锂盐后电流效率的增加应除去由于阳极效应系数增加对电解系列产生的负效应,指出了生产中每个电解槽承受添
有一次,我兴致盎然地在宿舍里讲笑话:从前有一对穷夫妻,一天有客来访,妻子忙着烧水,丈夫出去借茶叶。丈夫出去了很久,妻子一次又一次往锅里加水,烧了整整一锅开水,丈夫才回来,说没借到