代码-文档关联可追溯模型的研究和实现

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:MYUCHUAN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件工程各阶段产生的软件过程产品主要包括软件需求文档、设计文档、用户手册、测试用例、软件代码等,也就是说,软件过程产品主要以文档和代码的形式存在。因此,文档.代码可追溯关联挖掘对程序理解、软件维护、需求可追溯、变更分析和软件复用等许多软件工程活动有很大的帮助。尤其,随着国内软件的日益成熟,中文文档和英文代码之间新型的跨语言可追溯关联挖掘也逐渐成为当前研究热点。   现阶段缺乏自动或半自动地构建并维护文档.代码间的可追溯关联的有效技术段。本文首先深入研究现有的各种可追溯技术现有的可追溯关联挖掘技术,主要有静态关联挖掘技术和动态关联挖掘技术,,并分析了这些关联挖掘技术各自存在的局限。接着,本文系统地研究了当把文档和代码都看为静态文本时,检索技术(lnformation Retrieval,IR)在自动挖掘建立在语义基础之上的代码,文档的可追溯关联信息中的应用,并提出了基于潜在语义索引(LSI)的新的动态关联挖掘技术。   该技术在充分研究LSI的基础上,将机器翻译技术和信息检索技术LSI应用到中文文档-英文代码可追溯关联挖掘中,提出了可追溯关联挖掘模型,并在此基础上基于Matlab开发了可追溯关联工具TLG,基于潜在语义索引(LSI)关联挖掘技术解决了静态关联挖掘技术中追溯链难以维护的问题,为软件过程产品之间关联追溯提供一种切实有效的方法,将为软件的维护带来积极的作用。实验结果表明,查全率和查准率都有一定的提高,从而表明在提取代码与中文文档间可追溯性关联信息时,考虑中文文档和代码的固有特点和采用潜在语义索引,将有助于提高检索系统的查全率和查准率。
其他文献
CCD技术是20世纪70年代末投入使用的新型探测技术。由于线性度和饱和度比照相底片好、灵敏度高、易于数字化处理等优点,CCD一问世就被广泛应用于照相摄影、天文观测、空间探测、卫星测地、军事侦查等各个领域。CCD技术在国外发展很快,现在在国内也是相关行业研究的热点之一。而通用串行总线USB具有速度快、支持热拔插及传输线少等优点,因此将USB应用于CCD中可以很好地解决传统数据采集系统的不足,具有实际
无线传感器网络在军事和民用领域有着广阔的应用前景,是目前一个非常活跃的研究领域。与传统网络不同,无线传感器网络资源非常有限,其首要设计目标是能源的高效使用。如何节
功能CT成像有助于肿瘤的早期诊断,能提供关于肿瘤预后的信息,并能检测肿瘤的治疗效果,是一种简单、有效、易于开展的新的成像手段,对肿瘤诊治有一定帮助。本文主要是针对恶性肿瘤
随着计算机软件技术的发展和在各个领域的广泛应用,软件的规模越来越大,复杂度越来越高,在软件开发和维护过程中,由于软件错误带来的一系列问题越来越明显地威胁着软件的质量,其中
近年来随着高带宽网络的普及,流媒体应用包括视频直播、视频点播等业务得到了迅猛的发展,它们已经成为当代互联网服务的重要组成部分,成千上万的用户能够通过IPTV和视频点播业务
模糊聚类算法是一种重要的数据分析方法,具有能客观地反映现实对象隶属关系不确定性的特点,近年来已成为数据挖掘理论体系中研究的热点,并且在众多领域得到了广泛应用。   但
在网络应用服务发展的今天,信息获取已成为网民使用Internet的主要目的之一。由于传统搜索引擎存在不足及自身的局限性,限制了人们对资源的获取。现存的大多数元搜索引擎以线性
随着互联网应用技术的发展,富互联网应用成为新一代Web应用发展的方向。进入RIA时代之后,实时 Web应用大量涌现,致使Web应用中的数据实时性问题更加突现。传统的基于Pull策略的
科学与工程计算涉及国民经济建设、洪涝灾害防治,环境保护等重大领域,其水平也是衡量一个国家综合国力的重要指标,而这些问题最终都归结为偏微分方程的求解。虽然偏微分方程数值
配电网规划是电力系统规划的重要组成部分,对其进行科学合理的优化,寻找最佳配网决策将带来可观的经济和社会效益。生物质发电配电网规划是低压的配电网规划,根据变电站的容量及用户的负荷容量,设计最佳的网络结构,为用户提供长期稳定、并能满足用户需要的电力。生物质低压配电网涉及每个自发电站的位置、容量大小等非线性数据问题,同时服从每个自发电站容量、辐射状网络结构以及可靠性要求等约束,是一个非线性、多目标、多约