基于使用信息和聚类方法的多模式集成

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:gailuen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据集成是解决多数据源整合问题的有效手段.如何准确高效地集成多数据源模式具有重要研究意义.关于模式集成已有大量的研究工作,但均忽略了用户使用信息.在用户使用信息的基础上提出一种新颖的基于聚类技术的多模式数据集成方法.首先从数据库的查询日志中为模式属性提取特征向量,并对其进行聚类.然后根据结果聚类间的最小差异性,为每个结果聚类引入最大相似性阈值,利用该阈值发现结果聚类中与该类语义不相似的异常属性.最后针对结果聚类中的3类异常属性,设计3种异常属性去除规则,进一步提出异常属性去除算法EPKO.实验结果表明,该
其他文献
刘乃和先生执教五十多年,将毕业精力都献给了祖国的文化教育事业,"为师忧道不忧贫"是她发自肺腑的心声,也是她一生的真实写照.刘乃和先生勤勤恳恳,兢兢业业,执著追求,默默奉
高端容错计算机广泛应用于金融、电信等行业,选择合适的基准测试并设计负我模拟系统是对高端容错机性能评估和评测的重要手段之一.TPC-C基准因其完备性、持久性、跨平台等优点被人们广泛的应用于联机事务性处理(OLTP)的商业应用中.本文设计了基于TPC-C基准的负载模拟系统,并构建了相应的TPC-C基准评测环境平台,实现了对高端容错机性能的评估弄口测试.实验证明,上述方法是一种合理、有效的针对高端容错机
我国今天平等、团结、互相的社会主义新型民族关系,是历史发展的必然结果,它将在社会主义市场经济发展完善和改革开放逐步深化中得到进一步的巩固和发展.但民族问题也将随之
IBM公司近日研制出世界上最小的磁性存储位,仅仅由12个原子组成.其并非量子计算机,却达到了量子计算机的存储能力——96个原子便能够贮存1整个字节.而当前一只普通硬盘存储1比特
数字曲线的多边形近似是图像分析研究领域的一个热点问题.获取数字曲线的优化多边形近似是一个复杂的问题,其计算复杂度非常高.微粒群算法是近些年来提出的一种新的优化方法,已经被广泛应用于各种优化问题的求解.提出了一种求解数字曲线的多边形近似问题的基于整数编码的离散微粒群算法(IPSO).IPSO通过重新定义标准微粒群算法的速度和位置更新公式中的加法、乘法和减法运算,使得算法能运行在离散的解空间.IPSO
高校精神文明建设的起点是加强师德建设,其主体是学生思想道德建设,而加强“两课”建设是基本途径,开展丰富多彩的社会实践活动和校园文化活动则是必要手段。
[摘 要]培养学生的解题能力是非常关键的,是提高学生数学能力的核心。教师应结合学生的特点,从错题反思、实践体验和练习设计三个方面对学生进行引导,帮助学生加深对相关数学概念的理解,掌握解题技巧,从而丰富学生的解题思路和经验。  [关键词]小学数学;解题能力;有效策略  [中图分类号] G623.5 [文献标识码] A [文章编号] 1007-9068(2017)26-0073-01  影响数学解题能
中国古典诗词中的伤春作品,体现了中国古代文人对个体生命所生的忧叹,表现了对生命的珍惜,有着强烈的生命自主精神。体现了作者对符合人性要求的美好情感生活的热切向往与不懈追
由于网络环境的复杂性和网页内容的多主题性,要想得到更多的特定主题相关网页,就要穿越那些主题不相关网页来获取更多的主题相关网页,即隧道穿越.将隧道穿越分为灰色隧道穿越和黑