【摘 要】
:
谱聚类算法是建立在谱图理论上的一种点对聚类算法,具有实现简单、理论基础扎实和适应任意数据空间的优点,因而成为机器学习领域的研究热点。谱聚类算法最大的问题在于计算复杂度过高,而并行计算可以提高解题效率,因此本文采用最为流行的并行计算框架MAP/REDUCE在Hadoop环境中实现了并行谱聚类算法,大大改善了谱聚类算法在大规模数据环境中的聚类效率问题。
【机 构】
:
北京理工大学计算机学院 北京100081
论文部分内容阅读
谱聚类算法是建立在谱图理论上的一种点对聚类算法,具有实现简单、理论基础扎实和适应任意数据空间的优点,因而成为机器学习领域的研究热点。谱聚类算法最大的问题在于计算复杂度过高,而并行计算可以提高解题效率,因此本文采用最为流行的并行计算框架MAP/REDUCE在Hadoop环境中实现了并行谱聚类算法,大大改善了谱聚类算法在大规模数据环境中的聚类效率问题。
其他文献
目的评估同时行经尿道膀胱肿瘤电切(TURBT)和前列腺汽化切除(TUVP)治疗非肌层浸润性膀胱肿瘤合并有严重下尿路症状前列腺增生患者的疗效。方法对2004年至2008年期间45例行TUR
糖尿病足是糖尿病患者由于合并神经病变及各种程度不同末梢血管病变而导致下肢感染、溃疡形成和(或)深部组织破坏。糖尿病足病人中有15%~20%在其病程中发生足部溃疡或坏疽,糖尿病足的截肢率是非糖尿病病人的15~20倍。一旦发生糖尿病足,对病人的生活会产生极大的不良影响,甚至威胁病人的生命。有效的预防可以使糖尿病足发生率降低,从而提高病人的生活质量。因此糖尿病足家庭预防显得十分重要。很多糖尿病患者最关心
随着网络技术的不断发展,计算机技术在各领域得到了广泛的开发和利用。而远程监控系统因具有网络化和信息化以及直观方便的特点,被应用于许多领域,如远程协助、远程教学、远程办公等现代远程技术。本人将对计算机网络远程监控系统在代表性领域的应用以及前景情作了分析和研究。
文章介绍了射频识别(RFID)技术及基于此技术的高校实验教学管理系统的具体硬件和软件设计方案。应用该系统不仅可以实现对学生实验的智能化考勤,还可以方便教务、实验管理中心对全校实验课的上课情况做好统筹管理,是较理想的现代化管理手段之一。
本文主要讨论了针对校园网建设过程以及后期的使用和维护过程中,现代网络安全技术的应用。文章开头主要对校园网络做了简要介绍,并就当前环境下校园网建设过程中所面临的各种威胁做了深入地分析与研究。其次重点介绍了校园网络安全问题的一些具体表现形式。并就防火墙杀和毒软件的应用以及提高广大教师学生的网络安全防护意识两方面对网络安全技术在校园网建设中的应用进行了系统研究与讨论。文章最后在总结全文的基础上对未来校园
对于云数据库中查询过程中的连接操作来说,具有代价高且费时的特点,在分析大量的重复查询操作在云数据库应用中的基础上,为了提高查询效率,使得传输时间和计算时间极可能缩短,这里提出对于半连接过程进行优化处理,云数据库查询操作中间结果数量,包括相应的网络传输数量能在优化的半连接查询算法中大大减少。所以,对于复杂查询问题具有一定的实用价值。
在当前社会中,世界各地的企业之间竞争意识在增强,决定制造企业全球竞争能力的主要指标之一就是产品的开发时间、产品成本、产品质量以及产品应用。目前使用相对于广泛的就是"虚拟制造"技术,而人机工程分析则是虚拟制造"技术其中的一部分。为了适应目前市场的多变性质,减少企业成本和制作周期,"虚拟制造"技术逐渐成为最突出的一种。它能够在产品设计初期和开发的各个阶段有效的把握制造过程各个阶段的实际情况,同事也能有
随着网络技术与计算机技术的快速发展,计算机硬件虚拟实验对计算机专业学习越来越重要。为了满足专业学习的要求,在计算机的教学上运用模拟技术与仿真技术,建立虚拟实验室,实现计算机教学的虚拟平台。本文主要分析计算机硬件虚拟实验流程及关键技术,旨在为提高计算机教学水平提供借鉴。
根据社会就业形势,各个学校都加强了对实验课程教学的力度,实验课越来越成为教学环节中的重要内容。如何使实验课教学更规范,更生动活泼,有效降低实验课的管理成本,提高实验课的教学效果,增加学生的学习热情,这些都是本课题研究的内容。
为了更有效地在地震废墟中搜寻生命,设计了一种新型的分布式生命信号探测系统。该系统由主机器人与分布式探测小车组成,多个探测小车在救援现场构建起一个分布式无线自组网,通过网络传回被困人员图像等相关信息,为救援工作提供有力支持。