基于数据预处理的并行分层聚类算法

来源 :计算机应用研究 | 被引量 : 11次 | 上传用户:weijiang321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分层聚类技术在图像处理、入侵检测和生物信息学等方面有着极为重要的应用,是数据挖掘领域的研究热点之一。针对目前基于SIMD模型的并行分层聚类算法处理海量数据时效果不理想的问题,提出一种基于数据预处理的自适应并行分层聚类算法,在O((λn)2/p)的时间内对n个输入数据点进行聚类。其中1≤p≤n/logn,0.1≤λ≤0.3。将提出的算法与现有文献结论进行的性能对比分析表明,本算法明显改进了现有文献的研究结果。
其他文献
网络中大量数据存储在关系数据库中,利用这些数据资源构建领域本体是实现语义Web的任务之一。制定了一组优化的通用转换规则(特别注重对元组信息的语义分析与挖掘),结合领域专家的选择判断,在尽量保留和挖掘关系数据库语义信息的基础上,给出了一个从关系数据库半自动构建OWL本体的方法,同时利用WordNet对本体进行语义丰富,并最终通过系统实现转换过程。
白纹伊蚊幼虫对高效氯氰菊酯有较快的抗性发展速度,而成虫则抗性发展缓慢.该蚊幼虫对敌百虫的抗性发展速度显著慢于对高效氯氰菊酯的抗性发展速度.因此,在白纹伊蚊治理中,用
为提高多目标粒子群算法的局部搜索能力,提出了一种模糊学习子群多目标粒子群算法(FLSMOP-SO)。在搜索过程中,每个粒子模糊自适应学习生成不确定的p个粒子形成一个子群而不是只产生一个新粒子,然后在其中选择模糊满意解作为其下一代新粒子。对四个典型测试函数的实验结果表明,新算法比NSGAⅡ和MOPSO两种经典多目标优化算法有显著的优越性。
针对经典的粒子滤波视频目标跟踪算法进行粒子传播采用随机游走的方式,以及传统颜色直方图无法反映目标空间特征的问题,提出了一种改进的基于颜色的粒子滤波目标跟踪算法。该算法在统计目标二阶颜色直方图的基础上,获得粒子的观察概率密度函数,利用卡尔曼滤波确定粒子动态传播模型中的确定性漂移部分,使粒子状态估计值分布更精确地趋向目标的概率分布,大大提高了粒子的利用效率。实验表明,该改进算法的性能优于经典基于单一颜
通过体外扩增,克隆恶性疟原虫海南(FCCl/HN)株GLURP基因,测定其基因序列,了解该基因的结构及在FCCl/HN株与其它分离株间的序列差异.根据GLURP基因已知序列设计合成3对引物,用
从可信计算角度,提出一种可靠信任推荐文本分类特征权重算法,分析了特征在文档中的特性,基于Beta分布函数研究了特征与文档类之间的信任关系,建立特征权重计算模型,并实现简单高效的线性文本分类器。在比较实验中采用20newsgroup和复旦中文语料集。与TFIDF算法进行性能比较,实验结果显示该算法性能较TFIDF显著提高,并对非平衡语料具有良好的适应性。
本文在不同季节对采自北京4个城区的家蝇Musca domestica(L.)种群的乙酰胆碱酯酶(AChE)对杀虫药剂的敏感度进行检测.结果发现,在4个种群中,海淀区种群对敌敌畏、灭多威和残杀
目前本体学习的研究重点在于概念及关系的提取,概念提取领域一致度与领域相关度相结合的方法取得了比较好的效果,而关系提取则主要采用基于关联规则的方法。这种本体概念、关系学习方法由于只考虑词频,提取结果准确性欠缺。针对这种缺陷,在统计的基础上考虑了语义因素,利用词汇上下文计算概念的语义相似度并将其应用到概念与关系提取中。实验结果表明,词汇上下文与传统统计相结合的方法能够有效改进概念和关系提取的准确度。
为尽可能减少由于自然灾害导致铁路运输受阻甚至中断情况下受影响的列车数,提出了对现有列车运行方案以抗毁性优化为目标的量化分析方法。首先基于当前列车运行方案建立列车运行网络模型,该模型以实际铁路站点为节点,以实际铁路线为边,以每条边开行的列车数量为边权重;随后提出了一个称之为度权效应的抗毁性评价指标,并以该评价指标为目标函数,使用改进粒子群算法对网络权重进行优化。仿真结果得出了优化前后列车运行网络的抗
通过分析多目标的、有时间窗的车辆路径问题,对各个目标进行多属性模糊评判,结合相关专家的综合意见以及决策者自身对专家意见的偏好,将决策者对目标属性的离散意见转换为对各目标的综合意见;通过定义一种模糊综合排序指标来确定决策者对各目标的偏好权重,依据目标权重和各目标函数的规范化处理值,构建评价有时间窗的车辆路径问题的多目标模糊综合适应度函数;采用最大—最小蚂蚁系统算法对该问题进行求解;最后通过一个算例来