基于深度学习的程序识别算法的优化

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:fdazhyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习是基于机器学习领域的一个重要分支,主要优势在于捕获高度复杂的数据特征,实现复杂的非线性映射,现如今已成为主流的机器学习方法。目前深度学习在自然语言处理、计算机视觉等领域已取得一定的研究成果,但是在程序语言处理方面的研究仍不够成熟。程序算法识别是软件工程领域的一个研究热点,通过对程序功能的识别,提供了一种评估算法行为、程序功能和系统复杂性的方式,在软件模块重用、系统维护、软件开发效率的提高等方面有着十分重要的意义。但是程序语言具有丰富而严密的结构特征,无法利用传统的自然语言处理方法对其进行有效的训练。同时神经网络在训练过程中,由于梯度弥散和过拟合问题的存在,进而导致网络模型不能提炼出有用的程序结构特征,算法识别效果并不理想,因此如何优化现有的程序识别算法对算法识别效果的提高至关重要。本文首先介绍了无监督的预训练阶段中常用的四种激活函数,通过比较各个函数的优缺点,结合非饱和修正函数Softplus和ReLU的优点,构造出一种分段的非饱和修正激活函数Softplus-Relu。随后利用随机梯度下降算法(Stochastic Gradient Descent,SGD)实现了基于Softplus-Relu函数的程序向量表示模型,并将改进后的模型与基于其余四种激活函数的网络模型分别训练,最后对比分析实验过程中的收敛情况。结果证明,改进的(Tree Structures of Convolutional Neural Network,TCNN)将程序算法识别的准确率提高至95.8%,加速了监督训练近1/3的进程,从而完成对程序算法识别模型TCNN中预训练方法的改进。其次,因在监督训练过程中,模型过高的复杂度以及数据噪声的存在使得网络不可避免的产生过拟合问题,故本文对TCNN模型中的监督训练过程进一步优化,将系数为0.6的Dropout层附加在全连接层之后,并通过实验验证优化后模型的泛化能力。采用Dropout策略后,验证集和训练集在训练收敛时的准确率之差控制在0.5%左右,相比改进前二者3.6%的准确率之差,过拟合程度显著减轻。最后基于改进的激活函数和Dropout网络模型完成对程序算法的识别,模型的召回率和F1值均在97%以上。综合分析后得出结论,经过对TCNN模型中无监督学习和监督学习过程的分别优化,算法识别效果得到了较大提升。相比现有的程序分类模型,改进后的模型能够在广义程序算法识别上取得良好的识别效果。
其他文献
输电线路作为电网系统的重要组成部分,其安全稳定的运行是确保电网系统供电可靠性的关键;检修工作是保障高价值、长寿命的输电线路等战略资产的完整性、可用性和使用寿命的重要技术手段。目前,输电线路设计方案优劣的评判标准为初始投资成本的高低,使得初期设计时对后期检修需求与成本考虑不充分,而后期的运行维护费用大约是输电线路初始投资成本的数倍、乃至数十倍,因此不能仅仅以初始投资成本作为输电线路设计的评价指标。造
21世纪以来,为了解决农业、农村与工业、城市之间的矛盾,国家通过持续城市化对经济结构进行了调整,大大促进了经济的繁荣,居民物质生活水平有了大幅改善,同时也带来了巨量的生活垃圾;如果未能科学有效的对城市生活垃圾进行处理,必然带来一定的环境污染问题,导致城市生态发展受到一定威胁。上海市作为新经济城市的代表,肩负经济发展重任。随着经济的大跨步发展,外来人才及打工者大量向上海涌入,上海市生活垃圾产生量急剧
近年来,运动目标检测与跟踪技术在机器人视觉领域得到了较为广泛的应用,该方向的研究不仅是处理高层视觉任务的前提,而且涉及到多种学科领域,所以一直是视觉领域研究的重点和难点。本文利用摄像头所采集的视频仿生机器人视觉,重点对运动目标检测与跟踪的算法进行研究,为了提高检测与跟踪准确率,所做的工作内容如下:1)针对高斯混合模型检测算法获取到的运动前景目标存在“空洞”和阴影误检的问题,提出了一种改进检测算法。
大跨屋盖结构因能提供大面积无柱空间,已广泛应用于体育场馆、机场航站楼、展览中心等建筑中。这些屋盖结构具有跨度大、质量轻、阻尼小及自振频率低等特点;同时位于近地高湍度区域,其气流绕流现象与空气动力影响相当复杂;因此风荷载已成为此类结构设计的主控荷载之一。大跨结构面积一般都很大,在进行刚性模型测压试验时,风压测点数往往不能满足实际工程有限元节点数,给精细化的大跨结构抗风设计带来诸多不便,因此有必要基于
随着无线互联网络的广泛应用,对于高清视频进行压缩处理的需求不断提高,传统的视频编码只能够编码单一性质的码流,并不能够完全适应丰富多样的用户需求。而通过可分级视频编
近十几年,互联网取得了巨大成功,已成为人们日常生活不可或缺的部分。随着网络规模不断增大以及新的网络设备不断应用,造成网络管理日益复杂。根据相关研究表明,网络故障发生
我国处于地震多发带,砂砾土液化是常见的地震灾害现象,又由于砂砾料日渐短缺,寻求新型的抗液化性能好的回填料的研究十分必要和迫切。陈化的废弃钢渣可用于土工回填,但是由于
杜洛克猪自引入我国以来,经过多年驯化饲养,现已成为品种改良繁育的优质品种。然而,在不同季节杜洛克猪精液质量特性差异较大,尤其在夏季,精液体积和精子活力急剧下降,但夏季
EB病毒(Epstein-Barrvirus,EBV)全球范围内正常人群中感染率高达90%以上,中国更是EBV的感染大国。该类疱疹病毒一经感染终身携带,因此,大部分正常人群均存在EBV的潜伏感染。再次激活的EBV能够引发单核细胞增多症等相关疾病,而潜伏感染下的EBV某些病毒组分还与众多肿瘤的发生及发展密切相关。TLRs(Toll-like receptors,TLRs)作为模式受体家族中的关键部分
学位
2019年5G技术的到来标志着电商直播迎来真正的红利期,而传统“货架式”电商逐渐进入发展瓶颈期。电商主播是电商直播诞生的产物,其在电商直播中强大的营销能力大幅超过传统电商所带来的收益,这使得企业着手寻求全新营销路径的变革。学术界探索电商直播消费者行为的研究尚处于起步阶段。现有研究集中关注电商网站、社交媒体、虚拟社区和社交商务等情境的用户行为,借助S(刺激)—O(机体)—R(反应)理论框架来解释传统