面向非限定性中文需求文本的自动化本体构建方法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:baohuse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
需求分析是软件开发生命周期中最重要的阶段之一,聚焦于将用户片面、模糊的软件需求和期望转换为完整、精确的形式化规约。自然语言描述文档作为一种传统需求表达形式,一致性、完整性和精确性较差,通过构建需求本体可以有效形式化规约需求。随着软件规模逐渐扩大,手工构建需求本体已难以满足实践需求。国际上针对本体自动化构建的研究工作,较少涉及中文自然语言文档,且语言间的巨大差异性使得已有研究成果难以直接应用于基于中文需求的本体自动化构建过程。本文研究非结构化中文需求文本的自动化本体构建方法,包括基于模式匹配的知识三元组抽取和基于知识三元组的本体自动构建。论文的主要工作包括:1)提出一种知识三元组抽取方法。首先对需求文本进行预处理,包括分句和句法分析等;其次根据句法分析结果,参考中文句式特点,设计三类知识抽取规则,分别抽取中文需求文本中的概念、概念的属性和概念间关系。然后基于中文知识库How Net补充概念的隐含属性、定义补充三元组成分规则、设计停用词表去除无用信息,最后生成初步知识三元组集。2)提出一种本体构建方法。首先基于知识库How Net和Concept Net实现词汇间的语义计算,合并同义概念,实现需求信息的去冗余化;其次完成概念的层次关系补充和错词校验,提高需求信息的精确性;最后提出从知识三元组到需求本体的自动化构建方法,并通过推理规则约束完善需求本体,实现需求信息的一致性检验。通过需求文本分析案例实验,验证本文提出的需求本体自动化构建方法的有效性。实验结果表明:需求本体的自动化构建使得需求文档形式化,一定程度上避免了需求文本校对过程的人工参与,并提高了需求描述的一致性和精确性。
其他文献
唇语识别是融合了计算机视觉、语音识别和自然语言识别等多领域技术的课题,目的是解码说话者嘴唇运动生成的文本,具有非常广阔的应用场景和现实意义,目前最常见的是用于辅助提升语音识别准确率,也可以帮助听障人士进行交流等。随着深度学习的发展,唇语识别技术在英文方面取得了长足的进步,但中文无论是在数据集的丰富性还是识别的准确率上均存在一定的落差。本文通过分析中文的发音特点,利用深度学习技术,意图在句子级别进行
学位
智能问答系统可以满足人们对于精确信息的要求。对于问答系统而言,最重要的工作主要分为两个方面:对于用户需求的分析以及根据需求对于信息源的抽取。对于用户提问的分析主要依靠的是自然语言处理方面的知识,而近些年对于符合需求的信息的抽取则主要采用深度学习等方法。随着模型的进步,在问答方面的准确率也在逐渐提高,但是深度学习问答模型很大的问题就是对于推导过程的模糊性。本文通过引入多文档信息来建立包含相关知识的原
学位
软件测试中一个重要的任务是生成测试数据。对于图形用户界面(GUI)的测试数据生成而言,主要问题是一方面如何找到待生成数据的输入项,另一方面是如何为输入项构造测试数据。对于输入项识别而言,传统的方法是获取运行时底层系统提供的界面结构信息,然后对其解析从而获取输入项列表。对于输入项测试数据构造,传统的方法是基于界面结构详细信息或者软件内部源代码,通过白盒或者黑盒方法生成测试数据。以上方法尽管有效,但是
学位
目前,移动群智感知(Mobile Crowdsensing,MCS)是一种新的基于移动传感设备的感知模式。将传感器收集的信息与云服务的融合,MCS成为一个通用的感知服务平台,并具有广泛的商业应用。感知用户的参与和高质量的感知数据是平台可持续运营的重心。但由于参与感知任务会占用用户的时间和感知设备资源,甚至出现隐私暴露的风险,参加者可能会因为缺乏热情而退出感知平台。缺乏感知用户的调度必然会导致激励成
学位
多目标优化的目标是获得一组表示目标间权衡信息的解集。如何对解集进行有效评估和可视化是多目标优化中至关重要的问题。本文围绕多目标优化中的度量指标与可视化方法开展研究,主要研究包括以下三个部分。第一,本文提出一种改进型的基于自适应网格的修正反世代距离(Grid-IGD+)。Grid-IGD+具有Pareto一致性,利用种群自适应的网格系统生成均匀分布的参考点集,其密度保证其与近似解集的种群大小具有相关
学位
当前,我国城市化发展给城市交通带来了巨大压力,道路拥堵、乘客滞留、设施滞后等问题严重影响了居民的正常出行。因此,越来越多的城市居民考虑公共交通出行方式,而公交车作为整个公交系统中的关键一员,起着巨大作用的同时也存在线路规划欠优、站台乘客无法获取车内信息等问题。现如今,公交视频监控设备已经成为了公交车内的标配,其拍摄的视频数据具有易获取、易存储的特点。作为技术革新的产物,鱼眼摄像头在公交视频监控中的
学位
随着开源软件的兴起与计算机领域各项技术的飞速发展,代码仓库中所包含的代码体量日益膨胀,如何对这些海量的代码进行高质量地特征提取引发学术界的广泛关注。当下主流的是使用深度学习模型来提取代码特征,然而很多这些模型仅简单将代码视为自然语言,将其转化成一个标志符流再输入到模型如循环神经网络当中,这类模型完全忽略代码的结构信息仅能提取语义信息。为对代码的结构信息进行提取,一些研究人员应用树形神经网络并根据抽
学位
随着移动触屏设备的广泛应用,其上的应用程序的测试也愈发重要。传统的自动化测试技术需要获取被测设备系统内部控件的标签、索引、坐标等信息进行测试,侵入性强。诸如Sikuli、Airtest等的可视化测试技术提供了新的选择,此类技术基于屏幕图像而非系统内部的界面框架进行测试,对系统特性的依赖程度低,但仍然无法摆脱对设备内部接口的侵入性访问需求。对于一些如Go Pro、Switch等的不常见或系统封闭的设
学位
在产品功能和质量日益同质化、价格差异不断缩小的市场环境中,客户在关注生产成本与成品质量的同时,越来越重视厂家能否如期交货。因此,对影响交货期的主要因素,即产品完工时间进行研究是提高整体生产效率、确保按期交货的重要保障。为此,本文以某制造业企业实际需求为背景,设计了车间作业管理系统,并深入研究了作业调度优化和订单完工时间预测等关键技术,以此来满足高效排产、准确预测等多方面性能要求。本文主要的研究内容
学位
随着互联网大数据时代的来临,多视图数据在现实应用上愈来愈普及化,促使多视图学习得到愈来愈多的重视。多视图离群点检测便是其中一个非常重要的研究内容。每个视图中的实例之间存在相似性关联,根据个体相似性关联可以生成各种潜在的聚类结构特征,这样的结构特征一般由所有视图共享。但是,有一些样例在不一样视图归属于不一样的类簇,呈现出视图间的“不一致”行为表现,这样的样例被称作多视图离群点。多视图离群点检测是一个
学位