基于动态双子种群的差分进化K中心点聚类算法

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:sunjava2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着海量大数据的出现,聚类算法需要新型计算模式来提高计算速度与运行效率。本文提出一种基于动态双子种群的差分进化K中心点聚类算法DGP-DE-K-mediods(Dynamic Gemini Population based DE-K-mediods)。DGP-DE-K-mediods利用动态双子种群方法,解决聚类算法在维持种群密度的时候避免陷入局部最优的问题;采用差分进化(Differential Evolution,DE)算法来提高全局最优能力的强健性;基于Hadoop云平台来并行处理DGP-DE-K-
其他文献
随着互联网上Mashup服务数量及种类的急剧增长,如何从这些海量的服务集合中快速、精准地发现满足用户需求的Mashup服务,成为一个具有挑战性的问题.针对这一问题,本文提出一种融合功能语义关联计算与密度峰值检测的Mashup服务聚类方法,用于缩小服务的搜索空间,提升服务发现的精度与效率.首先,该方法对Mashup服务进行元信息提取和描述文本内容整理,并根据Web API组合的标签对相应Mashup服务标签进行扩充.然后,用基于功能语义关联计算方法(Functional Semantic Associati
通过对猪牙花的调查发现:在中国有2种猪牙花,还有重瓣和并蒂的植株,均可通过种子进行有性繁殖,也可用鳞茎、鳞座进行无性繁殖;世界猪牙花属约29种。最后还介绍了猪牙花在国内和国外的分布,分子水平和经济用途等方面的最新研究水平。
低资源神经机器翻译的研究难点是缺乏大量的平行语料来给模型进行训练。随着预训练模型的发展,并且在各大自然语言处理任务中均取得很大的提升,本文提出一种融合ELMO预训练模型的神经机器翻译模型来解决低资源神经机器翻译问题。本文模型在土耳其语-英语低资源翻译任务上相比于反向翻译提升超过0.7个BLEU,在罗马尼亚语-英语翻译任务上提升超过0.8个BLEU。此外,在模拟的中-英、法-英、德-英、西-英这4组低资源翻译任务上相比于传统神经机器翻译模型分别提升2.3、3.2、2.6、3.2个BLEU。实验表明使用融合E
融入权重信息的加权链路预测算法大都具有更好的预测效果,现有的大多数加权算法都是基于外部权重信息,基于网络拓扑结构权重的研究较少。针对此问题,提出一种利用无权网络的结构特征生成结构权重的加权链路预测算法。首先计算资源分配指标得到网络局部结构相似性,再利用DeepWalk算法学习网络结构特征生成节点向量得到余弦相似性,将2个相似性结合定义出网络的结构权重。最后在4个数据集上进行实验,将融入权重信息的3种不同类型相似性指标W-CN、W-LP、W-RWR与对应的无权指标进行对比。结果表明,融入结构权重信息的预测算
命名实体识别的目的是识别文本中的实体指称的边界和类别。在进行命名实体识别模型训练的过程中,通常需要大量的标注样本。本文通过实现有效的选择算法,从大量样本中选择适合模型更新的样本,减少对样本的标注工作。通过5组对比实验,验证使用有效的选择算法能够获得更好的样本集,实现具有针对性的标注样本。通过设计在微博网络数据集上的实验,验证本文提出的基于流的主动学习算法可以针对大量互联网文本数据选择出更合适的样本集,能够有效减少人工标注的成本。本文通过2个模型分别实现实体的边界提取和类别区分。序列标注模型提取出实体在序列
聚焦移动社交网络特征和用户隐私保护的多元需求,本文首次提出一种支持K-近邻搜索的移动社交网络隐私保护方案.方案首先构建融合细粒度访问控制的位置隐私安全模型,在此模型下设计面向移动终端的轻量级位置加密算法,并基于同态加密机制以及安全多方计算思想设计位置密文重加密协议以及K-近邻搜索协议,从而构建安全可信的协同搜索架构,保证服务提供商在无需解密位置的前提下,对用户与好友之间距离进行安全计算并排序,在保护用户位置隐私的同时满足其近邻搜索服务的可用性;除此之外,为了满足细粒度访问控制,方案提出基于公钥广播加密的好
鲁棒几何模型拟合是计算机视觉中一项非常重要且具有挑战性的研究问题.它已被广泛应用于人工智能领域的多个相关任务,如车道线检测、三维重构、图像拼接和运动分割等.鲁棒几何模型拟合的主要任务是从包含离群点和噪声的多结构数据中估计模型实例的参数和数量.然而,当前的模型拟合方法在拟合精度和计算速度上仍然无法满足实际场景中应用的需求.为此,该文提出一种基于非负矩阵欠逼近和剪枝技术的模型拟合方法,以提升模型拟合的
针对误差反馈循环卷积神经网络在运用到短时交通流预测时存在仅仅能接收时序误差序列,忽略交通流误差数据中隐含的空间拓扑特征,且在模型初始化时其采用的通用卷积神经网络初始化方法降低了模型训练效率的问题,本文提出一种优化的误差反馈循环卷积神经网络模型,在误差反馈循环卷积神经网络模型基础上根据预测误差数据的时空特性对误差反馈层进行结构强化,能够处理包含简单空间关系的误差序列。同时通过在模型训练的过程中分离模型产生的历史预测误差和训练误差,使得模型构建过程更加高效,加速了模型收敛速度。通过北京市四环道路交通数据的实验
基因组数据已广泛应用于科学研究、医疗服务、法律与取证和直接面向消费者服务.基因组数据不但可以唯一标识个体,而且与遗传、健康、表型和血缘关系密切关联.此外,基因组数据具有不随时间而变化的稳定性.因此,基因组数据管理不当和滥用将会带来人类所担心的隐私泄露问题.针对此问题,除了相关法律法规的监管以外,隐私保护技术也被用于实现基因组数据的隐私保护.为此,本论文对基因组数据的隐私保护理论与方法进行综述研究.首先,本论文根据基因组测序到应用归纳基因组数据的生态系统,并依据基因组数据特点分析其存在的隐私泄露问题.其次,
目的观察针刺治疗周期性乳痛症的临床疗效。方法选取2018年7月—2020年1月在北京市平谷区中医医院治疗的60例周期性乳痛症患者作为研究对象,随机分为观察组和对照组,每组30例。观察组予以针刺治疗,对照组予以安慰针刺。比较2组治疗前后视觉疼痛模拟量表(Visual analogue scale,VAS)评分、乳痛天数、乳腺腺体厚度、临床疗效及安全性。结果治疗后,2组的VAS评分低于治疗前,乳痛天数短于治疗前(P<0.05);观察组治疗后的VAS评分低于对照组,乳痛天数短于对照组(P<0.05)