基于最大信息系数的软件缺陷数目预测特征选择方法

来源 :电信科学 | 被引量 : 0次 | 上传用户:zhoushucheng0533
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统特征选择方法仅考虑变量间的线性关系而忽略非线性相关性,导致软件缺陷数目预测模型的性能较低的问题,提出了一种基于最大信息系数的特征选择方法。该方法考虑特征与特征以及特征与缺陷数目间的线性及非线性关系,将特征的冗余性分析和相关性分析分离为两个阶段。在冗余特征分析阶段,基于特征间的相关度,采用凝聚层次聚类算法将冗余特征分到同一簇中;在相关性分析阶段,依据特征与软件缺陷数目之间的相关度,对每个特征簇中的特征进行排序,然后从簇中选择排名靠前的特征组成特征子集。实验结果表明,该方法能够选择有效的特征子集
其他文献
掘进工作面具有粉尘大、湿度高的特点,掘进装备工作时煤泥容易附着在摄像仪镜面上。针对上述问题,研制了一种掘进装备摄像仪镜面清扫装置,该装置利用喷嘴进行吹扫,将粘附在摄
从漏电检测需求、漏电故障区段定位的价值2个方面分析了单相漏电故障区段自动定位的必要性。介绍了3种单相漏电故障机理模型即故障稳态过程序网络模型、故障暂态过程序网络模
深度学习和云计算的普及推动了计算机视觉在各行业中的广泛应用。但集中化的云端推理服务存在带宽资源消耗大、图像数据隐私泄露、时效性难以满足等问题,难以充分满足计算机视觉在行业应用上的多样化应用需求。而通信网络的双吉比特升级将促进视觉算法云边算法深层次协同。对基于云边协同的计算机视觉推理机制开展研究。首先对近年主流的云侧和边缘侧计算机视觉推理模型的优劣势进行了分析和阐述,然后在此基础上对云边协同计算机视
随着5G商用的全面开展,5G无线站点数目急剧增加,5G核心网需分层部署在区域/省/地市数据中心,以及数据中心规模化发展,导致能耗问题日益凸显。基于全网能耗主要占比,调研5G接入网络、核心网络和数据中心的能源效率评估方法。介绍了AI使能的基站节能技术及试点应用方案、AI应用于5G核心网的节能方式、AI使能的数据中心节能技术和试点应用方案,探讨了节能技术的挑战和未来的研究方向。对整体通信系统节能技术的
生鲜奶是我国奶业发展的重要方向,溯源体系对整个生鲜奶行业的发展至关重要。时效性强、问题事后发现、受害者难以追踪、质检体系难以获得信任四大问题是生鲜奶行业区别于其他农产品行业的主要特征,传统农业领域溯源机制甚至基于区块链的农产品溯源机制无法满足生鲜奶行业的溯源要求。设计了一种面向生鲜奶供应链体系的追溯系统方案RMChain,在满足现有区块链溯源机制的各种优点的同时,针对生鲜奶特点进行专门的优化,在用
针对"家庭内部组网段"的光纤组网介绍了基于ITU-T标准的"G.hn光组网方案"、参考PON接入网技术的"类接入网方案"、基于IEEE标准的"光以太网P2P方案",从技术特点、标准化、产业链发展情况等方面进行了分析、对比和展望。针对"FTTH入户段",阐述了网关位置优化、入户光缆延伸成端的价值和实施建议,试验数据显示其可以显著提升家庭网关Wi-Fi网络覆盖范围和无线接入速率体验。
随着数据类型、用户角色和应用需求的不断细化,以及大数据复杂的数据存储和流动场景的出现,大数据安全防护要求越来越高。以大数据安全特征和运营实践为切入点,分析了大数据安全特征和技术发展趋势,体系化地梳理和总结中国电信以"数据和人"为核心的大数据安全深度防御体系建设和运营实践;并对区块链、联邦学习、人工智能、零信任等新技术在数据安全流通、数据安全风险监测、数据访问控制的引入提出了思考和展望。分析了大数据
调制识别是通信系统的基础任务之一,在认知无线电、智能通信、无线电监管、电子对抗等领域均有着广泛的应用。近年来,基于深度学习的调制识别技术以其在特征提取和识别性能方面的优势,日益成为研究的焦点。系统地梳理了基于深度学习的调制识别技术,首先介绍了相关基础,随后详细阐述了其系统架构、数据预处理方式、深度神经网络结构、常用数据集以及评价指标,最后分析展望了该技术未来的发展方向。
物联网终端具有客户基数大、生产厂商多、应用场景复杂的特点,在日常维护过程中存在质差标准难以统一、定位定段困难的问题。针对上述现象提出一种基于行为画像的业务保障方法。首先基于关键指标分布特征构造企业质差指纹模型,借鉴统计学习中均值漂移聚类的思想,实现质差指标体系的准确搭建。然后针对调测终端与质差终端难区分、弱覆盖终端难识别等问题,构建了单客户质差行为画像,有效保证了模型的准确性。最后在现网环境进行了
针对三维模型数据量增大时加载速度降低且浏览不流畅的问题,在分析Cesium模型格式3DTiles的基础上,提出了一种三维模型轻量化技术。将模型中的纹理图片依据材质和模型网格进行合并,实现正确纹理贴图,降低了DrawCall调用次数;将纹理和顶点进行压缩,降低了纹理图片文件大小;采用Mipmap生成不同分辨率的纹理图片,有利于网络传输;使用LOD和三角面简化技术,逐级降低模型的顶点和三角面数量;根据