改进K近邻算法在报文预测中的应用研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:glei66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
航母体系中的通信网络比较复杂,通信网中传输着大量的数据报,数据报载体一般采用自定义的应用层协议。获取数据报中数据实体的方式为,首先识别数据报的协议种类,然后按照相应的协议格式进行解析。考虑到灵活性等原因,航母体系中的应用层协议设计方式导致了数据报只能轮询匹配本地的协议进行协议识别。由于这种试错性匹配的过程很耗时,一个数据报的解析可能就要试错性匹配成百上千种协议,在高并发的通信网络中,严重制约着系统的性能。经过调研发现,这类通信网络中的数据报序列根据时间是有规律可循的,所以本文建立了一个可以嵌入到系统中的模型学习其中的规律,来对未知数据报进行协议种类的预测,通过减少试错性匹配的次数,来达到加快解析的目的。目前应用在预测任务中的,主要有三大类方法,包括时间序列预测方法、传统机器学习方法、深度学习预测方法。航母体系这一类的通信网络,有场景多变性、高速实时性、数据报本身特征少等特点,而且要求算法模型具有系统的可嵌入性。深度学习预测等方法因为需要大量样本数据训练,而且训练出来的模型不能应用在另一种通信环境,不适用于多变场景。传统的K近邻是一个懒惰性学习方式,并不需要训练,可迅速投入任何多变场景中,但是其预测结果单一,近邻查找效率较低,不适用于高并发场景。为了解决以上问题,本文提出了一种加速前缀匹配K近邻模型(Speed Up Prefix Matching K Nearest Neighbors,SUPMKNN),既解决了K近邻算法中近邻查找慢的问题,也使K近邻的输出具有多样性和可靠性。本文的主要成果包括:提出了一种加速前缀匹配K近邻模型(Speed Up Prefix Matching K Nearest Neighbors,SUPMKNN)。该模型适用于数据本身特征较少,但是数据序列呈现规律性的数据集。模型改变传统的先算距离再选近邻的方式,而是通过空间换时间,对序列的规律进行提取并缓存的方式,直接命中K个近邻并提取出K个近邻在序列规律中的多个特征。最后再利用多元线性回归和逻辑回归计算每个近邻的相似度。使得预测结果具有可靠性和时效性。搭建了一套完整的通信网络仿真系统,应用算法并验证算法的有效性。仿真系统包括数据报实时解析系统、XML协议随机生成系统、数据报随机发送系统。其中数据报实时解析系统,类似于抓包工具Wireshark,抓取自定义数据报,并对数据报进行协议匹配和解析存储,用来检测算法的效果。XML协议随机生成系统和数据报随机发送系统,分别用来批量生成随机的协议和数据报,确保仿真数据的多样性和真实性,通过这两个系统搭建的仿真环境产生的数据报,被数据报实时解析系统接收,形成本实验的数据集。最后,将SUPMKNN与常用的轮询算法和频率算法做了对比,数据报解析效率明显提高。并且还与根据通信拓扑搭建的一个图神经网络模型做了对比实验,实验结果证明,SUPMKNN在准确率上不亚于训练好的自建模型。最终将SUPMKNN应用到系统中,大大提高了系统的吞吐量。
其他文献
在乳液泵组装的过程中,有时会产生外表机油污染、塑件缺胶和乳液泵表面磨损等问题。因此,在乳液泵整体拼装完成后,需要检查其外观是否有缺陷,确保产品的美观和质量。现在工厂对乳液泵外观检查时有人工和机器视觉两种方法,虽然人工检测方法简单,但速度慢、漏检率高;现有的机器视觉虽然可以实现自动化检测,但乳液泵表面纹理较为复杂,在人工设计算法提取图像特征时存在选取特征不合适、算法鲁棒性较差等诸多问题。基于此,本课
学位
为满足现代科技应用要求,无线通信系统朝着小型化、宽带化等方向飞速发展。作为无线通信接收和发射信号的关键部件,天线直接影响着数据传输的速度与质量。双极化天线具有缓解信号衰落、降低同频干扰、扩大通信容量等特点,因此在通信基站、卫星导航等领域被广泛运用。针对基站天线如何实现宽带化,双圆极化天线如何形成共口面、超宽带的问题,本文展开以下研究:(1)提出一种覆盖2G/3G/4G的宽带双极化交叉多偶极子基站天
学位
在现今工业生产中,非线性切换系统作为一类重要的混杂系统,它广泛运用于网络控制系统,无人驾驶,机器人系统等重要领域。针对被控对象设计控制方案时,外部干扰、磁滞非线性、死区非线性等因素都需要考虑进去。而在设计控制器或分析稳定性过程中忽略这些问题,可能会严重降低系统性能,甚至导致系统不稳定。为了解决这些问题,本文以Backstepping技术为控制设计框架,结合Lyapunov稳定性理论、平均驻留时间切
学位
随着信息技术的飞速发展,智能网联设备的普及为车联网应用提供了强大的平台,众多新型车联网应用应运而生,例如智能辅助驾驶、自动驾驶等。这类技术一方面为人们的生活带来了更加舒适的体验,另一方面也为车联网的高效运行带来新的挑战。新兴的车联网应用大多具有计算量大、传输时延低等特点。将移动边缘技术引入车联网,构建边缘车联网是解决上述问题的一个可靠方法。传统的边缘车联网需要部署大量的路侧单元或其他物联网设备,在
学位
听诊是筛选心血管系统和呼吸系统疾病最简单便捷的方法,该方法具有高效、非侵入的优点。通过听诊器能够得到表征心脏和肺部器官健康状况的心肺音信号。在现实生活中,医生使用听诊器直接听取得到的声音信号常是心肺音的混合信号,这种混合的心肺音信号很难用于精细化的病症分析。深度学习已被证明可用于心肺音信号的分离,基于深度学习的心肺音分离方法有较好的分离效果、较多的网络层数和较大的网络规模。但是,它们对计算机设备的
学位
自2015年开始,我国为解决高校扩招带来的劳动力激增问题,对大学生创业这一壮举进行宣导和鼓励。此后,中国经济领域面临又一波澜壮阔的创业高峰,初次创业人才络绎不绝,全民科技创新也热潮翻涌。高新技术崛起和普及应用极大地推动了科技创业的爆发。但是在繁荣的大浪潮下,又有众多企业刚起步就面临破产或关闭,它们在强烈的竞争中昙花一现,还没能力立脚就被横扫出局。根据2018年国家统计局出具的报告,我国初创企业在五
学位
数控技术作为决定高端制造业发展水平的重要技术,对我国制造业的发展起到举足轻重的作用。传统的数控设备在进行加工时依据提前编写好的存放在系统中的数控程序,对工序复杂的工件进行加工时,可能因为技术人员的水平或者操作的问题,造成成本上的不必要增加。传统的数控设备稳定性高,但在开放性和成本问题上存在一些不足。基于以上提出的问题,并且结合用户需求和数控设备加工时的特点,本文旨在设计开发一套基于自动编程技术的运
学位
经济全球化背景下,提升自主创新能力是我国建设创新型国家和发展制造业的重要举措。习总书记提出实体经济对中国由大变强的重要性,并突出强调了制造业要以创新为核心,掌握关键核心技术。在此背景下,中国整车制造企业如何利用技术提升自主创新能力,从而攀升价值链中高端,是业界和学术界关注的重点问题。企业作为创新的主体,企业的自主创新离不开技术资源的支持,而技术资源的获取与利用来自于企业技术生态位的培育和研发合作网
学位
随着科技的不断进步和研究人员对Sigma Delta调制器研究的不断深入,单位高阶的Sigma Delta调制器在实际生活中也被广泛运用,而它的组成结构主要包括负反馈结构的高阶环滤波器和一个单位量化器。但是该调制器的环路滤波器为非有界输出稳定,从而会导致调制器失衡。为了使该调制器能够稳定运行,可以通过对环路滤波器进行合理的设计,从而可以得到信号带内较小的噪声传递函数并且把噪声集中迁移到了信号带的外
学位
伴随着科技的快速发展,很多新式通讯设备随之涌现出来,致使越来越多的通讯设备需接入通讯网络来互相交流,传输信息。因此,如何高效利用频谱显得越来越重要。认知无线电网络是一种比较高效的解决方案,其主要任务是对频谱资源进行管理,而频谱资源管理主要包括了两个核心问题:功率控制和信道分配。功率控制指的是在不干扰到主用户的通信情况下,次用户可以调整自身的发射功率来接入授权频段,达到与主用户共享频谱资源。信道分配
学位