基于Spark的Top-k对比序列模式挖掘

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:lantaiwin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对比序列模式(distinguishing sequential pattern, DSP)指在目标类序列集合中频繁出现,而在非目标类序列集合中不频繁出现的序列.对比序列模式能够描述2个序列集合间的差异,有着广泛的应用,例如:构建序列分类器,识别DNA序列的生物特征,特定人群行为分析.与挖掘满足支持度阈值要求的对比序列模式相比,挖掘对比度top—k对比序列模式能避免用户设置不恰当的支持度阈值.因而,更易于用户使用.但是现有的top—k对比序列模式挖掘算法难以处理大规模序列数据.对此,设计了一种基于Spar
其他文献
数字内容的爆炸式增长大大推动了数字家庭对于以磁盘为基础的存储需求。个人录像机(PVR)或者个人计算机(PC)随机内置的单个驱动器已经不能满足消费者的要求。因此,这就刺激了附加
从农业转基因生物安全管理实际工作出发,对如何切实加强这项工作进行了探讨。
“没有消防官兵的奋力相救.就没有我妻子的平安和女儿的健康出生。”开县汉丰镇南郊村二组村民谢勇在女儿满月的“三朝”酒席上,斟上满满一杯酒。他来到张军牺牲的地方,将酒洒在
1月20日下午,重庆消防协会在总队执行所召开了第一次常务理事会议。出席此次会议的常务理事共有25人,符合法定人数,重庆消防协会第一届理事会理事长周建修主持了会议。
1月13日下午,新华社重庆分社总编辑任卫东一行到总队参观指导工作,副总队长周崇敏、防火部副部长王德智会见了任总编辑一行,双方进行了亲切友好的交谈。
吉时利仪器公司推出最新的4225-PMU超快I-V测试模块,进一步丰富了4200-SCS半导体特征分析系统的可选仪器系列。它在4200-SCS已有的强大测试环境中集成了超快的电压波形发生和
在当前信息化背景下,移动教学模式逐渐成为现代地学课程实施的新途径。通过耦合移动学习端的资源优势,基于联通主义视角构建地学课程资源平台,提出以地学知识节点为中心、移
本文研究了微乳液为介质时,铁与1-(2-吡啶偶氮)-2-萘酚(PAN)的显色反应。选择730nm处为测定波长,ε为1.4×10^4L.mol^-^1.cm^-^1,铁量在0-50μg/25ml范围内符合比耳定律,该法适用于汽油中环烷酸铁的测定。
根据皖南沿江地区的自然特征,认为影响种植业生产的主要自然灾害类型为洪涝灾害,旱灾,生物灾害和气象灾害,分析了灾害形成的原因,从实际出发提出了综合治理,培植生态农业,合理布局,因
根据库尔勒香梨所发生的冻害特点,分析形成冻害的原因,提出了香梨冻害的预防与补救措施.