面向大规模图数据的分布式并行聚类算法研究

来源 :第29届中国数据库学术会议 | 被引量 : 0次 | 上传用户:ananluo2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  图聚类作为一种重要的图数据挖掘技术,在许多实际应用中已得到广泛的关注。针对图数据日益普及、规模不断增大的现实,提出了一种高效的分布式并行图聚类算法,即MR-LSH算法。该算法是在MapReduce框架的基础上,通过对传统的位置敏感哈希(locality sensitive hashing,LSH)算法的并行化改造,使其可在分布式的集群环境中实现对大规模图数据的高效聚类。通过在真实数据集上的实验,表明该算法的可行性与有效性。
其他文献
文章介绍了一个具备测试系统的可重构性和测试套优化性的DHCP一致性测试系统.DHCP一致性测试系统的设计采用分层设计、底层封装以及公用API的方式来实现系统软件的可伸展性,通过有限状态机模型(FSM)描述DHCP的状态变换,并使用了二叉树形式表述测试套设计的继承性以达到简单优化测试套.
针对藏文舆情分析中藏文印刷品和藏文图片内容无法自动监测的难题,文章在深入分析印刷藏文字符特征和藏文文本特点的基础上,提出支持多字体印刷藏文内容监测系统的实现方法,重点阐述藏文字符的特征提取、分类算法以及藏文文本内容监测方法。
文章提出一种基于策略访问控制模型的单点登录技术,使用以属性和规则为核心的访问策略表达资源的安全需求,一方面通过建立信任联邦实现跨域的身份认证,另一方面通过部署基于SAML标准和XACML模型的层次式属性权威机构进行域内、域间的策略评估,为分布式环境下的单点登录和授权提供了一种安全的解决方案。
祖冲之序列密码算法是中国自主研究的流密码算法,是运用于下一代移动通信4G网络中的国际标准密码算法,该算法包括祖冲之算法(ZUC)、加密算法(128-EEA3)和完整性算法(128-EIA3)三个部分。目前,已有对ZUC算法的优化实现,而专门针对128-EEA3和128-EIA3的硬件实现与优化,尚未见公开发表的论文。文章设计了祖冲之序列密码算法的IP核,该IP核基于ZUC算法模块,同时支持128-
“非法调查公司”是信息社会进程的产物,其对整个社会的信息安全构成了严重威胁。近期,公安部部署了打击侵害公民个人信息的专项活动,查处了多个“非法调查公司”。作者通过对相关资料的分析,结合此次打击过程中的实际情况。首先,对“非法调查公司”本身进行了研究,界定了称谓,经营业务及手段等;其次,对其行为进行了分析,总结出行为的特点、危害等;最后,作者从三个方面分析了防控面临的主要问题并有针对性的提出了防控对
Office系列文件是计算机取证中遇到频率最多的文件之一,除了文件内容对调查取证有帮助之外,其中内嵌的丰富信息,由于其不可篡改,有着很高的证据效力。由于Office文件的封闭性,这些信息不容易被解析和分析。文章通过解析Office文件的组织结构,详细阐述这些对计算机取证有帮助的Office文件解析方法。
文章从几个方面结合已发生过的与物联网有关的安全事件,对未来物联网通信、设备系统及设备上应用可能面临的风险做了重点阐述。
文章利用隐马尔可夫模型从网络实名的采集、登记、对象、验证、纠错、法律以及身份冒用检测等方面阐述了一个可行、有效的网络实名体系的构建方式。
设计并实现了一个实时复杂事件处理(CEP)引擎。引擎能够快速检测复杂事件,并通过估算最坏响应时间确保引擎的实时性。基于实时CEP引擎,实现了针对独居老人的智能家居监控系统。系统使用无线传感器网络监控老人行为及环境状态,使用实时CEP引擎实时检测复杂事件并发出通知。系统具有灵活性与实时性,能够满足独居老人家居环境中对响应有截止期要求的复杂多变的应用场景的监控要求。
随着各类无线移动设备(如智能手机、平板电脑、GPS导航仪等)的广泛普及,各种基于位置变化信息而提供相关服务的工具日渐受到研究者的关注.借助这类工具,用户可以对路况等一系列信息做出更加准确和有价值的判断和决策.为更好地满足用户的位置跟踪预测需求,借助于Java及Eclipse开发平台,设计实现了一种基于频繁模式的不确定性轨迹预测系统PathExplorer.考虑到移动对象历史轨迹存在的诸多不确定性,