代码挖掘中的数据处理方法综述

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:trytry11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
程序代码中蕴含着软件开发人员最原始的开发理念、设计思想和编程习惯等信息,将数据挖掘用于分析处理这种编码痕迹以便提取出潜藏着的有用知识是一个有着广阔前景的新的研究领域.由于当前的挖掘程序尚无法直接处理这种文本结构的程序代码,因而研究者需要将软件代码抽象成一种更有效的中间表达形式来作为挖掘对象.这种中间表达形式不仅界定了挖掘所使用的算法,更重要的是,它决定了所能挖掘的知识内容.对代码挖掘的一般过程进行了介绍并着重分析了代码挖掘的各种中间表达形式的特点.在此基础上,指出了当前代码挖掘存在的问题及今后的发展方向.
其他文献
简要梳理将货币和证券引入一般均衡理论的研究成果,可以发现经典的阿罗-德布鲁一般均衡理论框架难以容纳纷繁复杂的货币金融现象,新的研究成果是在突破原有理论框架后取得的.
根据1989年和2000年的两期Landsat-TM数据,应用景观类型斑块等级结构和景观空间格局指数等景观生态学指标,对地处典型农牧交错带地区的兴和县景观结构进行研究.结果表明,该地
商业战略会通过影响一个公司对风险的态度进而影响公司的避税行为,从上述理论出发,文章研究了商业战略和避税行为之间的关系,发现与采用探索者战略的企业相比,采用防御者战略
随着商家对PC客户端的占领需求,越来越多的软件被植入到计算机系统中,让用户无法摆脱,而且有的还会隐藏起来窃取计算机机密,成为目前计算机安全的一个非常严重的问题。文章的
碳纳米管作为极具潜力的新型热控材料,其本征热导率是最重要的热物性参数,得到了广泛研究.总结了近二十多年来在碳纳米管本征热导率方面的研究成果,归纳为实验测量和理论方法
航空燃油污染对于整个燃油系统故障有举足轻重的地位。燃油流量以及质量是实时监测的重要参数。对于三支路交叉管道的燃油污染分布情况,设计了以蒸馏水为模拟介质,通过pH测定
对设计的基于贫油预混蒸发(LPP)的多点喷射低污染燃烧室头部方案,对其性能进行了数值研究.头部为中心分级燃烧,设计为同心圆式主、副模分区燃烧方式.主模燃油为多点喷射.应用
从采用传统露天酿造工艺的中国酱油发酵酱醪中分离筛选嗜盐乳酸球菌,对其进行形态、生理生化特性研究及16S rDNA序列分析,在此基础上确定其分类地位,为研究其在酱油酿造中的
电子文件管理软件规范是电子文件管理软件开发的基础,而我国至今没有电子文件管理软件市场准入规范出台,文章分析了我国电子文件管理软件目前存在的问题,提出了市场准入的规
采用溶胶-凝胶法制备了PbF2·SiO2纳米晶玻璃陶瓷块体;利用TG-DSC和IR技术分析了干凝胶在热处理过程中有机基团的分解及内部原子键合方式的演变;结合XRD和TEM研究了凝胶玻璃