基于开源治理最佳实践集的成熟度评估模型

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:bluelee530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在开源这几十年的发展中,有的开源项目盛极一时却又迅速落幕,有的开源项目却始终保持屹立不倒。PostgreSQL始终是最活跃的开源关系数据库,无人出其右;而在Docker横行的年代,Kubernetes却异军突起,俨然成为了行业的实际标准。究其根本,还是开源社区这份“土壤”不同,导致了开源项目走上了不同的发展道路。而一个开源项目的治理水平对开源社区的发展起到了决定性作用。因此,如何对一个开源项目的治理程度做出正确且高效的评价就成为了具有重要研究意义的科学命题。在开源不断发展的过程中,一些具有现实意义的开源治理最佳实践逐渐被大家所认可。基于这些最佳实践,许多学者对开源治理展开研究并提出了多个评估开源治理成熟度的指标或模型。本文深入介绍了其中较为流行的模型与相关项目,通过对比,分析了各自的优缺点,发现无论哪种方法都存在准确性与效率上的失衡。有的模型效果虽然好,但是评价过程非常复杂,导致存在较高的使用门槛;有的模型评价过程较为简单,因此效果也不尽如人意。针对目前存在的开源治理评估难、效率低问题,本文从开源协作场景出发,构建了一套开源治理最佳实践数据集CIISet,提出了分段拟合与双层注意力机制相结合的开源治理成熟度评估模型OSGMAM,基于异质图神经网络对开源治理成熟度评估模型的复杂多元非线性关系进行回归拟合,从而展开自动化评估,最后基于预训练模型设计并实现了开源治理评估系统OpenCertified。具体贡献点如下:(1)构建了开源治理最佳实践数据集CIISet:为解决开源治理研究领域中缺乏高质量数据集的问题,本文对CII认证数据、GitHub日志事件数据进行采集分析,详细阐述了各类数据的数据结构与元数据结构。经过清洗、整合后构建了开源治理最佳实践数据集CIISet,最后对CIISet的整体结构与真实数据情况进行展示,并对图数据集整体性质的进行了分析。(2)基于异质图神经网络的开源治理成熟度评估模型:针对开源协作场景存在的不平衡性,本文提出了分段拟合与双层注意力机制相结合的开源治理成熟度评估模型OSGMAM。通过异质图神经网,对CIISet构建的开源协作子网络进行特征抽取,经由下游回归任务对开源项目的治理成熟度进行自动化评估。最后通过在CIISet数据集上与其他模型进行对比实验,结果表明本模型相对于其他模型在开源治理成熟度评估上有准确性的优势。(3)开源治理评估系统OpenCertified设计与实现:基于开源治理成熟度评估模型,本文还设计并实现了开源项目治理成熟度评估系统OpenCertified,提供开源项目查询、数据自动采集存储、开源项目治理成熟度评估等功能。OpenCertified采用B/S架构,部署在服务端运行,提供用户快捷使用的开源治理评估能力。通过对系统进行功能与性能测试,验证了 OpenCertified具有完备的功能与较好的性能表现。总之,本文围绕开源治理成熟度评估展开研究,构建了 CIISet数据集,基于异质图神经网络提出了面向开源治理的成熟度评估模型OSGMAM,最后设计并实现了开源治理评估系统OpenCertified。实验结果表明,与其他模型相比,OSGMAM在开源治理成熟度评估上具有准确优势。
其他文献
随着城市化的深入发展,亲子旅游逐渐成为现代都市群体非常重视的一种生活方式,在疫情之前各种以亲子为卖点的长途游和境外游产品市场反响火爆,亲子消费市场蓬勃发展。然而疫情的出现压缩了广大游客的出行空间和时间,城市内的亲子休闲产品应运而生,其中尤以各类亲子乐园的发展最为迅猛,为疫情期间低迷的旅游市场注入了一针强心剂。然而亲子乐园有别于传统的大型主题公园,其在游乐设备、营销模式、软硬件服务等各方面存在较大差
学位
目前联邦学习面临的一个关键挑战为数据分布异质性挑战,其主要表现为各参与方的数据分布是非独立同分布的(Non-IID),它使得各参与方在训练本地模型时,产生模型性能偏移问题,显著降低模型收敛性能和实用价值。此外,当联邦学习面临海量设备参与的大规模场景时,昂贵的通信开销会成为主要的训练瓶颈,尤其是对于那些通信带宽受限的设备,这将限制联邦学习在实际场景中部署应用。因此,如何提高联邦学习算法在Non-II
学位
全同态加密是当下最先进的隐私保护技术之一,它允许直接在密文上进行运算,相当于原始数据上的相同操作,并且在理论上可以实现无限次同态操作。全同态加密技术的运用场景广泛,它在云计算、安全多方计算、门限签名、电子投票等领域都起着重要的作用。特别是在云计算场景下,资源受限的客户端设备可以运用全同态加密将计算密集型任务安全地外包给半诚实的服务器进行计算,在此过程中不会向服务器透露原始数据集的任何信息,这对云计
学位
近年来,随着我国经济社会地不断发展,人民生活水平提升迅速,其健康意识的程度也在加强深化。同时随着老龄化进程的加速、家庭结构的变化,社会公众对于医疗机构护理质量提出新的要求与期待。但现实却呈现多方困境与掣肘,护理需求缺口不断增大与医护资源紧缺之间的矛盾,催生了护工队伍的形成;但围绕护工管理甚嚣尘上的负面反馈,令社会大众加大了对护工行业的关注与讨论。作为补充性护理人员,护工源于市场需求,能及时弥补住院
学位
随着钢铁货运需求的不断增加,钢厂道路拥堵、货车排队时长不确定等问题日益凸显,极大地影响了钢铁货运效率,亟需设计有效的钢厂货车滞留时长预测方法。据钢铁物流数据分析,货车在钢厂的滞留时间主要包括货车厂外排队时长与其在仓库滞留的时长两部分。然而,钢厂不同仓库装卸货作业能力的差异性、货车排队时长的长尾分布、货车在钢厂滞留的多阶段等特性,使得钢厂货车滞留时长预测面临严峻挑战。鉴于此,本文基于真实的钢铁物流数
学位
随着物联网的发展,现有的存储系统无法满足海量小数据块的存储需求,传统元数据架构也无法应对剧增的元数据规模,因此开发一款可扩展且高效的时空大数据架构用来存储、查询、分析和可视化是十分重要的。由于固态硬盘(SSD)和非易失性快速存储器(NVMe)接口等新兴技术的出现,基于非易失性存储器高速(NVMe)的固态器件在延迟和峰值带宽方面提供了前所未有的性能。但是,内核的复杂I/O堆栈阻碍了NVMe固态硬盘的
学位
<正>游戏是幼儿的基本活动,让幼儿在游戏中主动学习、自主发展,这是当下幼儿园课程改革的价值追求。通过有效观察发现幼儿游戏生长点,以环境和材料有效支持幼儿游戏发展,基于幼儿现有经验、当下兴趣及发展需求建构高品质的游戏课程,成为幼儿园课程实践和教育研究的热点。我园以充分、有效、多元、深入、融合为关键词建构游戏课程,
期刊
项目化学习是指学生在真实情境下研究并解决复杂的问题,从而掌握关键能力,该教学模式满足当前育人要求。故笔者基于“+1”教学法改良校本化中职专门用途英语项目化学习框架(下称框架),依次由框架中的项目目标、情境、活动、评价体系梳理具体环节的设计要素并确定项目设计实施路径。根据中职学习的职业性,笔者总结对接职业标准的五点设计原则:项目目标对接技能标准;项目情境对接岗位一线;项目活动对接工作任务;项目评价对
学位
核心素养这一观念在《教育部全面深化课程改革落实立德树人根本任务的意见》中被首先明确提出,以后这一观念被进一步不断的深入挖掘和研究。在《普通高中生物学课程标准(2017年版)》中将高中生物学的核心素养具体提炼为四个主要方面,生命观念、科学思维、科学探究、社会责任,明确了高中阶段生物学课程所需要实现的育人目标,指明了高中教师今后在教育教学中的主要方向。本研究在高中课堂中运用情境化教学的课堂教学策略,探
学位
为慢查询添加合适的索引是提高查询性能的一个有效方法,主要通过数据库管理员等技术人员的专家经验手动选择,或者由基于规则、代价、学习等算法自动推荐索引。无论是哪种方法,都没有考虑到在索引上线到真实业务系统前对其进行评估,其有效性和安全性难以得到保障。这是因为关系数据库一般以代价模型作为执行计划选择的主要依据,而其只是将各类预定义的操作粗鲁地代价化,同时查询优化器获得的统计信息由于数据变更、数据倾斜等因
学位