论文部分内容阅读
随着Internet技术和软件复用技术的发展,开源软件资源成为具有复用价值的重要软件制品。开源软件资源的可信评估有助于软件开发者快速、有效地复用开源软件资源。而在评估中,相关证据的获取是基础。本文面向开源软件资源的可信评估证据获取技术展开研究,通过对现有开源软件项目/资源证据获取相关技术的调研和总结,确定了在面向开源软件资源的可信评估证据获取工作中尚存在若干需要完善或提高的技术问题。 本文从证据的收集和提取、证据的可信性分析以及证据的描述三个方面制定了面向开源软件资源的可信评估证据获取技术框架,并以此技术框架为研究路线,探讨了证据的收集和提取、证据的可信性分析以及证据的描述等的相关技术。本文主要研究的内容包括: (1)研究了证据收集和提取的相关技术,提出了一种基于Web站点引用的证据提取方法。开源软件资源被:Internet中Web站点的引用被认为是一项评估开源软件资源的有效信息。基于这一背景,本文同时考虑了开源软件资源的Web站点引用数量和引用了开源软件资源的Web站点的质量,提出了一种基于Web站点引用的半监督学习方法,对资源的推荐信息进行提取。本文利用了SourceForge上的真实数据对该方法进行实验验证。实验结果表明,本方法能够有效利用Web站点引用提取开源软件资源的推荐信息。 (2)研究了证据的可信性分析和保障技术,提出了一种基于信任网络的主观反馈可信性分析方法。复用者对开源软件资源的主观反馈是一类重要的主观证据。本文针对复用者主观反馈中存在的不可信赖反馈问题进行了研究。本文将复用者不可信赖反馈的问题转化为对可信赖主观反馈提交者的发现问题,提出了一个基于信任网络的主观反馈可信性分析方法。本文通过模拟数据和来自Epinions.com的真实数据对本方法进行了实验验证。实验结果表明了本方法在发现可信赖反馈提交者的有效性。 (3)研究了多种来源、不同类型证据的描述机制,提出了一个基于来源的开源软件资源可信评估证据模型。在此基础上,本文基于证据模型给出了一个开源软件资源的可信评估框架。本文调研了可获取的开源软件资源证据的来源和类型,提出了一个基于来源的开源软件资源可信评估证据模型,支持开源软件资源证据的描述。证据模型具有一定的通用性,支持多种来源、不同类型证据的描述且易于对新的证据来源和证据类型进行扩充。本文对该模型进行了实例分析。实例分析的结果表明,该证据模型能够较好地支持对多种来源、不同类型证据的描述。 为了进一步说明该证据模型能够对开源软件资源可信评估提供的支持,本文基于该证据模型给出了一个开源软件资源的可信评估框架。可信评估框架支持复用者定义其对开源软件资源的期望,并基于证据模型和获取到的证据对开源软件资源是否满足复用者的期望进行验证。 (4)围绕上述研究和技术,本文设计并实现了相应的证据获取原型系统,并将其集成到北京大学软件资源库系统中。本文设计并实现了一个面向开源软件资源可信评估的证据获取系统,为北京大学软件资源库中超过7000个开源软件资源获取了相应的证据信息。该系统有效地结合了上述技术和方法,支持证据的收集、存储和访问等功能。