论文部分内容阅读
背景:近年来,软件工程的研究进展极大的丰富了该领域数据资源和知识储备。研究人员越来越需要在充分利用已有的研究结果基础之上开展新的研究。系统化调研(Systematicliteraturereview)正逐渐成为一种被软件工程领域广泛使用的研究方法。其目的是对于某一特定研究问题,查找、评估与其相关的所有可能的文献资料,并通过文献阅读与分析的方法从这个相关文献集中寻找特定研究问题的答案。在其他学科领域,例如生物学、医学等已有了广泛的应用。系统化调研被证明是一种客观,全面,有效的调研方式。然而,出现在研究人员面前的一个问题是,尽管系统化调研方法在软件工程领域取得较好结果,但是同时也带来了大量的人力和时间成本。
目的:本文提出一个基于本体的软件成本估算知识获取方法,自动化辅助软件成本估算的系统化调研。为此,本文基于自然语言处理技术和本体技术提出了一种新的知识获取方法。该方法根据系统化调研及软件成本估算领域经验知识构建本体,对文献摘要进行分析和信息抽取,为软件成本估算系统化调研提供支持,减少人力和时间消耗。
方法:首先,基于系统化调研执行准则以及摘要的组织结构构建一个通用的实体结构SLRONT,作为更详细的本体的构建基础。接着,进一步在软件成本估算领域对SLRONT进行扩展,根据历史研究成果以及领域相关研究成果构建软件成本估算本体COSONT。然后,采用词法分析、语法分析和启发式规则构建一个知识获取规则集合,并利用这些规则对非结构化摘要进行结构化处理。再使用词法分析和语法分析方法从结构化摘要的方法部分与结论部分抽取概念知识,用这些概念知识实例化COSONT本体。最后本文通过两个案例分析说明如何使用COSONT辅助软件成本估算系统化调研。
结果:分析结果表明,基于本体的软件成本估算系统化调研本体COSONT能较好的辅助系统化调研的执行。对非结构化摘要进行结构化划分能够达到70%左右的正确率。辅助执行系统化调研文献筛选时能够得到与人工方法一致的筛选结果,而节省了手工筛选的时间。辅助执行系统化调研数据抽取时能够节省近2/3的时间,并得到同人工分析一致的结论。
结论:本文提出的辅助软件成本估算的知识获取方法能够高效的辅助系统化调研。利用词法分析、语法分析和启发式规则能够对软件成本估算文章摘要进行较好的结构化处理,准确的获取文章摘要中的知识。