分布式系统中离群数据间相似性挖掘

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:boli257758
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文讨论了分布式环境下各站点离群数据之间相似性度量及挖掘算法,该算法利用基于距离的离群数据挖掘算法挖掘离群数据,然后计算离群数据的知识集,最后依据各站点知识集的分布情况来判断离群数据之间的相似性。由于时间关系,本文的算法只是理论探讨,接下来的工作是将本文算法加以实现,从而分析算法的效率。
其他文献
随着Internet的发展,电子邮件作为快捷、廉价的现代通信方式,已经成为越来越多人的重要通信选择方式.大量"垃圾"邮件的存在是不争的事实,它们既浪费人们的时间,又占用宝贵的
会议
在分析了原有的支持度--可信度框架不足的基础上,本文介绍了一种新的兴趣度度量:完全可信度、联结度,同时证明了完全可信度和联结度具有的一些性质,然后在划分算法的基础上,提出
日本电电公司横须贺电气通信研究所把非击打式打印机与DIPS 联机使用进行汉字信息输出,具有世界上最高的印刷速度15,000行/分。本印刷机除能印刷汉字外,还具有文字的扩大、
本文对数据挖掘关联规则的改进算法-SDA算法进行了研究。理论研究和实验结果表明,新算法SDA算法的效率比经典算法Apriori算法有较大的改进,比DHP算法也更优越.这个主要是在三个
Web服务是一种新型的可以通过Web来调用的软件组件.根据业务流程组合不同的Web服务可以实现复杂的业务流程,促进不同类型应用的集成,支持企业内部和企业之间的相互协作.本文
会议
本文建立了一个应用集成语义模型,提出了一种平台结构的应用集成体系结构,井着重讨论了其中的基于语义的信息交互和集成。该语义模型由资源语义模型、计算语义模型以及二者之间
在基于机群系统的并行数据库中,多连接查询优化是一个重要的研究内容。本文提出了基于遗传算法的并行优化算法BGA,在估算查询执行计划的代价时,考虑了资源的分配信息和网络的通
会议
本文就中间件与IP欺骗技术结合逼近Web测试真实环境进行了研究,研究表明,通过使用CORBA中间件控制多台计算机协同工作,并且每台计算机运用IP欺编技术使本机的多个线程使用不同的
本文在超节点P2P网络的基础上进行扩展,加入了元数据的自动抽取、集成和结构化查询,以及并行多点下载等功能,形成了一个高效的P2P文件共享系统模型EfficieatPeex 。实验表明,多点
本文通过扩展TWF-net模型,提出了一种解决工作流中并发流程间资源冲突的方法。这种扩展的模型继承了TWF-net模型中转移时间对的概念,能够清楚地描述流程中活动之间的时间约束关