基于多源数据的组织架构推理系统的设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:gengboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究一个组织的架构对于了解该组织的运作方式、定义组织的性质、发现其关键节点、发掘核心部门和锁定重要人物以及判断该组织运行状况、刻画组织全貌等方面都有着重要作用,在情报咨询、商业调查、投资分析、打击非法组织等方面有着广泛的应用。现有的组织架构构建算法多是基于对单一数据源的分析,这种方法的缺陷在于很难刻画出目标组织的架构全貌。针对以上问题,本文提出了课题研究目标,即构建出一个基于多源数据的,包含信息采集、数据分析、组织架构推理与构建等功能的组织架构推理系统。在数据集构建方面,本文设计并实现了分布式多源组织架构数据采集系统,从多个源头增量式获取新闻、公开简历、组织官网简介等有价值的数据。为了构建目标组织的基础架构,本文针对公开简历等半结构化信息和官网介绍等非结构化信息分别设计了不同的数据挖掘方法。其中,对于文本数据的处理,本文设计了基于统计与深度学习的组织实体和关系抽取模型,实验结果表明了该方法的有效性。为将从多个数据源抽取出的部门关系图融合成为最终的组织架构,本文设计了基于等价实体融合及概率图模型推理的组织架构融合与推理算法,以推理出目标组织的架构。最后,本文设计并实现了基于多源数据的组织架构推理系统,以满足用户的使用需要。本文在已构建数据集上对组织架构推理算法进行测试,测试结果表明本文方法的准确率超过了现有采用单一数据源的方法。对设计和实现的组织架构推理系统进行了性能和压力测试,测试结果表明系统具有良好的并发访问能力和稳定性。
其他文献
理解在软件仓库中执行的维护活动可以帮助软件从业者减少维护成本,做出关于资源分配的决策,从而提高效益。对于大多数软件系统来说,bug是通过软件仓库的问题追踪系统来跟踪的,代码变更是以提交给源代码控制库的形式来合并的。因此,检查软件开发的这些基本工件(新的错误报告或提交)来实时检测bug是很方便的。本文的目标是自动对软件开发过程中的一系列提交进行高精度分类,将提交分类为bug修复相关或与bug修复无关
近几年,以MOOC平台为典型代表的在线教育平台正迅猛发展。在线教育没有中高考等门槛,没有必须在某个地方才能学习的要求和弊端。这让每个人都可以平等地享受到名牌大学的优质教育,学习者可以根据自己的兴趣和需求,自由地选择有兴趣的,流行的或者是大家都称赞的课程。但是,这在为学习者学习提供极高的便捷性的同时,也割裂了传统课堂学习环境下,学习者和其他人的直接接触。由此导致了学习者总是习惯于独自学习,没有动力去
在实际的深空探测任务中,当探测阶段处于接近段时,探测器距离小天体较远,搭载在探测器上的窄视场相机无法清晰地观测到小天体表面的纹理信息,只能观测到轮廓信息。在此阶段准确恢复出的小天体模型,会为近距离详细测绘阶段探测规划提供依据,同时为近距离高精度小天体三维重建任务提供初始模型。如何应用小天体的轮廓信息准确恢复其三维模型对于小天体探测任务具有重要意义。本文从相机外参数精准、相机外参数存在误差两方面出发
近年来,人工智能技术(AI)已经在很多领域获得了极大的发展,但高精度机器学习模型往往依赖大量的有标注数据,而在很多诸如医疗、军事等实际的应用场景中,样本的获取非常困难,标注也需耗费高昂的人力成本,这极大的限制了AI的应用。此外,现在的机器学习模型越来越庞大,利用大量数据从头训练需消耗巨大的计算资源,然而,人类却具有利用少量样本快速学习的能力。因此,使机器也像人类一样具有在少样本条件下进行鲁棒性学习
考试是一种严格的知识水平鉴定方法。通过考试可以考核学生的学习能力和知识储备。为了保证考试结果的公正、公平性,考场必须要有很强的纪律性和约束性,并且专门设置有主考、巡考等考场工作人员监督考试过程,绝对禁止任何形式的作弊行为,否则作弊考生将要承担法律责任和刑事责任。传统的监考手段主要依靠人力监考,即在每个考场设置相应的考场工作人员进行监考、巡考、处理考场突发情况等事务。大规模的集中考试会消耗考试机构大
随着计算机软件的蓬勃发展,软件漏洞的数量也飞速猛增。漏洞修复成为越来越重要的问题,传统的代码审查对于软件从业人员专业素养要求较高,而且随着软件规模的增大,仅依靠代码审查无法满足漏洞检查的要求;基于规则的漏洞自动化检查技术对代码进行检查需要依靠专家所定义的规则;传统机器学习方法对漏洞进行检查需要人工提取特征;近年来深度学习的发展为漏洞检测提供了新的研究方向。然而现有的研究存在对代码的结构信息利用不全
阀门轴是决定阀门质量和可靠性的关键零件,其加工方面的瓶颈近几年已基本解决,检测方面却形成短板效应:尺寸公差主要靠人工检测,形位公差主要靠设备保证,对于加工后的变形则主要靠零件返修。使用落后的检测方式难以保证航天产品的可靠性,因此研究设计一套专用的阀门轴类零件作用直径自动测量系统是十分有必要的。本文提出了一种轴类零件作用直径自动测量系统的设计方案,设计采用线性CCD对待测轴类零件直径与作用直径进行非
随着互联网时代的到来,信息化已经成为当今社会的趋势。随着计算机技术在工业界、产业界以及人们日常生活中的广泛应用,产生了海量的数据。在海量数据中,往往包含着丰富的信息,有待于发掘和分析,为智能化时代的智慧问答、辅助决策、推荐系统等提供更加有力的支撑手段和理论依据。因此,从海量的数据中提取有效的信息,并归纳总结成能够为各行各业提供帮助的知识,已经成为大数据时代人们的共同目标。在人工智能技术、机器学习技
为了解决司法文书的语法错误纠正及文本质量估计问题,本文通过多种方法及实验研究上述问题的解决方法。通过研究当今研究现状,了解当前领域的常用解决方案,并融合司法文书相关特征,对于司法文书文本纠错问题,提出面向司法文书的基于规则和语言模型的纠错方法以及基于深度模型的纠错方法;对于司法文书文本质量估计问题,提出基于语义理解的文本质量估计方法。通过实验,证明上述方法可以较为有效地对司法文书中的语法错误进行纠
大多常规的行人重识别数据集都是在较短时间跨度内收集的,这期间行人的服饰与外观基本不会发生改变。但在例如商场监控、罪犯追踪等很多现实应用中,同一个人的衣服可能会更换,不同的人也可能穿着相似的衣服,常规的行人重识别方法过于依赖行人的服装信息来进行行人匹配,不适用于这种服装变化场景下的行人重识别任务。本文针对服装变化的行人重识别问题进行探究,基于深度卷积生成式对抗网络提出了一种特征解耦方法,用于分离服装