【摘 要】
:
数据挖掘在大数据时代是一个关键性技术,聚类算法在数据挖掘领域举足轻重,因此对聚类算法的研究和应用具有理论和实践意义。本文以吸引子传播(Affinity Propagation,AP)聚类算法的深入研究为主要研究方向,针对AP聚类算法难以确定参考度,分别从算法思想、群体智能、密度聚合和领域交叉的角度进行了若干理论改进和应用研究,具体内容包括:(1)提出了基于近邻点整合的加权相似度吸引子传播(Inte
论文部分内容阅读
数据挖掘在大数据时代是一个关键性技术,聚类算法在数据挖掘领域举足轻重,因此对聚类算法的研究和应用具有理论和实践意义。本文以吸引子传播(Affinity Propagation,AP)聚类算法的深入研究为主要研究方向,针对AP聚类算法难以确定参考度,分别从算法思想、群体智能、密度聚合和领域交叉的角度进行了若干理论改进和应用研究,具体内容包括:(1)提出了基于近邻点整合的加权相似度吸引子传播(Integration Neighbor Points-Based Weighted Similarity Affinity Propagation,IW-AP)聚类算法。将近邻点以类中心点为基准进行整合,使邻近数据点的信息合并重整,扩大了搜索有用信息的范围,并用加权相似度替换传统吸引子传播聚类算法中的参考度,使参考度更具代表性。通过仿真模拟实验结果表明,本文提出的改进算法聚类精度与原始算法相比具有显著提升。(2)提出了基于鸡群优化的吸引子传播(Chicken Swarm Optimization-based Affinity Propagation,CSO-AP)聚类算法。引入sil评价指标作为鸡群优化算法中的适应度值,通过鸡群优化的方法,对AP算法中随机给定的参考度进行迭代,多次迭代后将鸡群最佳位置赋予AP算法中的参考度,完成优化。通过仿真模拟实验结果表明,本文提出的改进算法聚类结果优于原始算法。通过将CSO-AP应用于34家酒店旅游公司,对财务数据聚类的良好结果表明该算法具有一定的实践能力。(3)提出了基于密度聚合的吸引子传播(Density Aggregation-based Affinity Propagation Clustering Algorithm,DA-AP)聚类算法。将AP算法聚类后得出的聚类中心作为新的数据,利用DBSCAN聚类算法的思想将高密度的临近点聚合为新的簇,更新所有样本点的类标签,无需调试参考度的值。通过仿真模拟实验结果表明,本文提出的改进算法较原AP聚类算法聚类精度高、对流型数据处理效果更佳。通过将DA-AP聚类算法应用于外汇市场,33条热门汇率良好的聚类效果反应了DA-AP聚类算法的实用性。(4)提出了基于注意力机制的吸引子传播(Attention-based Affinity Propagation,AttnAP)聚类算法。吸收注意力机制中Soft Attention模型的原理,筛选出需要重点关注的核心样本点,获取相似度矩阵,优化参考度使其取值更加适用于数据集。通过仿真模拟实验结果表明,本文提出的改进算法相对于原始AP聚类算法聚类结果更佳。通过将AttnAP聚类算法应用于5G概念股,47支股票数据具有特征性的聚类结果表明AttnAP聚类算法具有实际应用能力。
其他文献
近年来,世界各国经济快速发展,随之带来能源的巨大消耗和环境日趋恶化。我国作为发展中国家,能源消耗位于世界前列,但我国能源结构较为单一,环保性能差。为解决能源日益不足问题,世界各国研究人员将重点转移到生物质能源方面,作为一种新型清洁能源,生物质能被广为关注。目前,生物质能的开发利用在我国仍然离不开政府的扶持,如资源综合利用的企业可享受增值税即征即退的优惠政策等。生物质发电行业在我国虽有所发展,但是因
国有企业是国家经济的支柱、是国民经济的主导力量,掌握着大量国家资源。国有企业领导人员是企业的决策者,在国有企业的经营决策中发挥重要作用。而实践中,国有企业存在资产流失、贪腐频发、重大经济决策失效等诸多问题,因此,对于领导人员权力的制约势在必行。国有企业领导人员经济责任审计从中国特色社会主义国情出发,强调对国有企业领导人员履责的监督、对腐败的预防、对离任的审计,有利于深化国有企业改革,完善国有企业运
自改革开放以来,我国资本市场不断完善。为了适应经济的发展,并购成为目前企业迅速占领市场份额的首选方式。我国并购交易数量十年来节节攀升,现已成为全球第二大并购投资地域,并购市场已初具规模。随着企业并购交易经验的不断丰富,企业对并购实施的考察更审慎和全面,更注重为了企业的长期发展寻找更真实和可靠的目标企业,并购审计的作用随之显现。但企业并购跨期长,并购过程复杂,涉及大量的财务核算内容,多方的利益关系加
20世纪70年代,信贷资产证券化作为一种创新型金融工具,因其会降低银行及其他金融机构流动性风险的特殊运作机制,在以美国为首的西方国家范围内极为推崇。当下,我国商业银行整体资产流动性较为充足,但单个银行的资产流动性仍有待提高,银行内部存在资产负债结构错配、信贷质量低等问题,近几年银行面临的流动性风险压力剧增。信贷资产证券化业务可与银行实现真实交易,将银行内部流动性差的信贷资产转化为流动性强的资金,大
魔法故事又称幻想故事、神奇故事,是民间故事中的一种,属于阿尔奈和汤普森“AT分类法”中的300-749型故事。泰国魔法故事是泰国民众智慧和文化的结晶,它诞生于民间并传承、发展于民间,是极具民俗性和传统性的一类民间文学,具有重要的研究价值。泰国魔法故事的显著特征是“魔幻性”,故事中存在大量超自然的情节、神奇人物及奇幻行动。本文以故事中的超自然形象作为切入点展开对泰国魔法故事的研究,深入探析泰民族视野
目的:观察运动预处理对大鼠大强度运动后心肌线粒体钙代谢的影响,探讨线粒体钙单向转运体(mitochondrial calcium uniporter,MCU)在运动预处理改善运动所致心肌线粒体钙代谢紊乱中的作用。方法:8周龄雄性SD大鼠32只,适应性喂养一周后,随机分为空白对照组(C组,n=8)、一次性大强度运动组(EE组,n=8)、运动预处理+一次性大强度运动组(EP组,n=8)、MCU抑制剂+
近年来,我国大气污染问题严重。大气污染在危害自然环境的同时,还阻碍了经济与社会的发展,更为严重的是给公众的身心健康造成了巨大的负面影响。另外,各行政区域划分与大气污染的流动性之间有着矛盾,尤其针对地理位置邻近且都存在污染的区域,如果政府只专注于本辖区内的治理,而不考虑合作共赢,是很难在治理大气污染工作中取得成效的。而且地方保护主义和政府之间的利益博弈长期存在,难以实现政府之间的良性合作。因此,建立
粮食安全关乎国之根本,民之基本。我国历来关注粮食安全问题,党的十九大报告更是提出要确保粮食安全,把中国人的饭碗牢牢端在自己手中。要想解决养活14亿中国人的问题,则需要加大金融支持粮食安全的保障力度。金融作为现代经济资源配置的核心,全面有效的金融支持是保障粮食安全的重要途径。本文通过对粮食安全、粮食金融化和金融支持相关文献进行梳理,同时借鉴相关理论,发现随着粮食金融化程度的加深,粮食价格异常波动,甚
纤维素是地球上最原始、储存量最多的天然化合物,是世界上最广泛和最丰富的有机可再生资源,但由于其结构的特殊性,纤维素本身不易被降解,利用率极低,因此将纤维素含量高的物质降解变成有价值的物质,一直深受关注。相比于物理和化学降解法,采用微生物降解具有明显的优点,并在许多行业产生了诸多作用,比如在食品工业、发酵工业及环境保护工业等,然而纤维素的高效降解始终是制约纤维素生物质应用的关键。鉴于目前纤维素降解菌
农村合作金融作为农村金融重要的组成部分,在解决小额信贷资金需求方面发挥着重要作用。但是随着农村信用社在“去合作化”道路上渐行渐远,我国农村合作金融市场逐渐出现了空缺,这一空缺急需新的农村合作金融形式来弥补。近年来,在国家政策的引导下,一些新的农村合作金融组织如雨后春笋般出现在人们的视野中,如经原银监会批设的农村资金互助社、贫困村资金互助社和以农民专业合作社为依托的信用合作组织等。本文在合作经济思想