基于文本图元素提取的数据流图自动生成方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:mq909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流图作为软件工程需求分析中必不可少的一部分,在软件分析和软件质量保障方面发挥着重要作用。在经典的软件工程方法中,以人工设计为主要方式的数据流图存在出图效率低的缺点。因此,通过自动提取软件需求文本中的图元素,进而提高出图效率和质量具有重要的研究意义和应用价值。本文设计了一种自动提取数据流图图元素的方法,该方法先通过文本分类从软件需求文档中筛选出包含图元素的关键句,然后使用命名实体识别从句子中提取出数据流图图元素。本文研究工作包括:(1)针对软件需求文档中无关信息会干扰图元素提取的问题,本文提出了基于需求文档权重矩阵的文本分类方法,该方法根据软件需求文档半结构化特点,构造标准软件需求说明规范目录权重矩阵,并将其与句子级文本向量进行特征融合。我们使用需求文档数据集,在提取关键句的文本分类任务上进行实验。实验结果表明,与基于句向量的文本分类方法相比,融入了权重矩阵后关键句分类准确率提高了 5.82%,经过权重矩阵的特征融合,能够降低文档无关目录下的句子对分类结果的影响。(2)针对目前基于序列标注的命名实体识别方法提取图元素信息准确率不高的问题,本文将数据流图规则作为先验知识,提出结合先验知识的图元素命名实体识别方法。该方法将先验知识编码成特征模板,结合模型的上下文信息挖掘图元素特征,获取条件概率最大的输出序列表示,并对输出序列表示进行规约性先验知识的合理性校验。我们使用带图元素标注的文本语句数据集,在数据流图图元素提取任务中进行实验。实验结果表明,与基于序列标注的命名实体识别方法相比,该方法的图元素提取准确率提高了1.9%,经过先验知识校验后提取的图元素更接近人的认知。基于上述研究,本文设计了一个自动提取文本中数据流图图元素信息的工具,并使用真实的企业软件需求文档对其进行测试。测试结果显示,该工具能够有效提取出文本中包含的图元素信息,且自动生成参考性顶层数据流图,节省人工分析的时间,对生成更深层次的数据流图有借鉴意义。
其他文献
锂离子电池作为储能装置,打破了以往的碳基燃料为主的供能方式,有效促进了碳排放的减少,为能源的可持续发展提供了新途径,广泛应用于消费电子领域。如今,随着汽车电动化趋势来临,对锂离子电池的性能提出了更高的要求。石墨作为商业化锂离子电池的主要负极材料,其低的理论容量,限制了锂离子电池性能的进一步提升,寻找新型锂离子电池负极材料以满足高性能锂离子电池的需要迫在眉睫。本论文通过形貌控制、结构优化等方法合成了
有限群论与组合设计理论之间有着紧密的联系,对设计的自同构群的研究可以有助于我们解决设计的分类问题或者发现新的设计.反过来,通过设计的自同构群又可以帮助我们更清楚地了解某些群的结构.本文是在前人的研究基础上,研究点数v不超过15的2-(v,k,λ)设计的区传递自同构群,主要结果如下:定理3.0.1.设D=(P,B)是一个非平凡的对称2-(v,k,λ)设计,v≤ 15,且群G是D的区传递自同构群,则下
随着中风患者的数量不断增加,康复医疗资源紧张引起的康复支持不足问题越发严重。传统康复依靠医护人员的经验和复杂的量表,这对发展中国家短缺的医疗资源来说是非常严峻的考验。因此,对基于传感器的生物信息反馈进行研究和应用十分有必要。当前,包括红外摄像头、表面肌电信号(Surface Electromyography,s EMG)、惯性传感器等多种传感设备已经被大量应用于康复领域。然而,仅仅采集宏观运动信息
我国国土空间规划体系“四梁八柱”基本形成,“五级三类四体系”的规划编制与传导机制已经初步建立,并对各级各类规划提出应当明确规划重点与健全规划实施传导机制的要求。但是着力于促进区域协同发展的区域规划,与地方城市的法定规划与专项规划之间目前仍然缺乏具体传导路径,区域规划目标泛化与模式,导致规划成果难以得到落实。区域规划作为反映国家意志与省发展战略,以及指导地方城市规划编制的重要层级,如何明确区域规划的
现代化工行业逐步向集成化形式发展导致化工园区数量逐年上升,但化工园区火灾、爆炸、毒气泄漏典型事故的起数与后果未得到有效控制。由于化工园区聚集有大量易燃、易爆、有毒危险化学品,一旦发生化工事故极易对化工园区企业及周边群众人身安全和财产损失造成严重威胁。深入研究化工园区事故场景下应急疏散与应急救援问题,有助于降低化工园区事故所造成的人员伤亡,为化工园区应急决策提供参考借鉴。本文主要研究内容包括:(1)
聚酰胺12粉末因具有制件重量轻、耐腐蚀且机械强度高等优点,被广泛应用于机械、医疗与化工等各个行业中。本研究基于常压法制备聚酰胺12粉末,通过实验与模拟相结合的方式探究了聚酰胺12的溶液结晶热力学、熔融结晶动力学和工艺条件对制备过程的影响。具体研究内容如下:首先,对常压法制备聚酰胺12粉末的过程进行研究,采用X射线粉末衍射仪(PXRD)、差示扫描量热仪(DSC)及偏光显微镜对产品进行表征。通过实验探
山水林田湖草沙是一个生命共同体,推动国土空间生态保护与修复对于维护国家生态安全,保障经济社会可持续发展具有重要意义。我国高度重视生态保护和修复治理工作,但仍存在科学基础较弱、组织机制不完善、投入资金不足、修复技术及其标准缺乏等问题,影响了国土空间生态保护修复工作成效。未来需要按照推进生态文明建设的要求,完善山水林田湖草沙一体化保护修复工作,建议:(1)更新修复理念,以科学规律为基础开展系统保护修复
与圆钢管混凝土柱、方钢管混凝土柱相比,矩形钢管混凝土柱中钢管对于核心混凝土的约束作用不足,钢管易局部屈曲,承载力及延性相对较差,制约了矩形钢管混凝土柱的实际应用。针对上述问题,本文提出了一种矩形钢管混凝土柱的改进截面形式--内配椭圆箍筋矩形钢管混凝土柱,通过内配椭圆箍筋有效约束了核心混凝土,提升了矩形钢管混凝土柱的承载力及延性。为给该类柱的实际应用提供理论支撑和科学依据,本文主要开展了如下工作:1
二维金属-有机框架(2D MOFs)纳米片作为一种新型纳米材料,由于具有超高的比表面积、可控的纳米级别厚度、丰富的表面活性位点等优点,在催化、气体分离和能源转化等领域具有广泛的应用前景。然而,现阶段2D MOFs纳米片的制备往往存在厚度不均一,形貌不可控等问题,特别是单层2D MOFs纳米片的合成尤为困难。因此,如何实现2D MOFs纳米片的精准设计与合成仍然是一个重大的挑战。基于此,本论文利用“
Ambisonics是一种基于物理声场重构的空间声重放系统,它通过空间谐波的展开,逐级逼近目标声场,重现目标声场的空间信息。得益于其严格的理论基础,自二十世纪70年代起源以来一直被国内外广泛研究。Ambisonics声重放将各阶空间谐波作为独立编码信号,并将其线性组合译码为扬声器信号,实现一定频率和空间范围内目标声场的精确重构。然而受到空间采样定理的限制,超出频率上限,将产生重构声场误差从而引起可