【摘 要】
:
随着网络飞速发展,网络的规模越来越大。互联网络已经发展成为一个巨大的、分布广泛的信息库,基于这个巨大信息库的应用将产生同样巨量的网络日志,这些网络日志蕴含着极其丰
论文部分内容阅读
随着网络飞速发展,网络的规模越来越大。互联网络已经发展成为一个巨大的、分布广泛的信息库,基于这个巨大信息库的应用将产生同样巨量的网络日志,这些网络日志蕴含着极其丰富的可能被挖掘的隐含信息。对这些挖掘出的隐含信息进行分析,可以提高网络提供的服务质量,有助于网络性能管理等。贝叶斯网络是目前不确定知识和推理领域最有效的理论模型之一。本文将贝叶斯网络运用于网络日志挖掘,为从网络日志中找出潜在的有用的信息,进行方法框架的尝试研究,以有助于网络管理时做出正确的决策,提高网络服务质量。本文描述了如何运用贝叶斯网络来挖掘一个真实的每天约有一千万条数据的大型网络日志,以达到预测网络流量的目的。为了挖掘这么大的数据集,本文首先用一些准则过滤和归并了数据集,并通过进一步地离散化,把原始的数据集转化为用于贝叶斯网络学习的规整的数据集。然后针对单个小时和一天的数据分别采用基于评分的方法加上ORSearch搜索算法和贝叶斯网络增量学习方法学习出贝叶斯网络模型,在构造出的贝叶斯网络的基础上通过计算变量间的条件概率来预测网络流量。大量的测试结果表明,预测网络流量的正确率从48%左右到80%左右,导致这些差异的可能原因包括:预处理数据的离散化技术,从巨数据集学习贝叶斯网络的具体方法,数据本身的噪声处理方法等。本文为挖掘巨量真实的网络日志提供了有益的尝试。
其他文献
随着计算机与计算机网络中软件系统越来越大型化与复杂化,对软件系统的性能要求也越来越高。自动控制发展的一个重要趋势是不断扩大应用领域,其中包括控制理论与方法在软件系
近年来毫米波技术迅速发展并且逐渐得到了广泛的应用,其中毫米波压控振荡器作为毫米波射频收发机中的关键部分也逐渐引起了广泛的关注。压控振荡器对于接收机和发射机的性能有
XML是W3C推荐的一种通用标记语言,凭借其自描述性、可扩展性、半结构化等特点,逐渐成为Web上数据表示和交换的标准,在多个领域都有广泛应用。随着XML文档的大量涌现,如何从海
从60年代开始人们由于应用的需要就提出了虚拟机技术,从硬件到软件都有。随着计算机技术的飞速发展,CPU的速度越来越快,存储容量越来越大,虚拟机技术也如雨后春笋般地发展起
目的 探究氯吡格雷在急性心绞痛治疗中的疗效.方法 选取2018年1月至2020年1月收治的38例急性心绞痛患者进行研究,通过采用随机数表分组,分为对照组和观察组,每组19例,对照组
RTU(Remote Terminal Unit,远程终端单元)是构成SCADA(Superviser Control And Data Acquisition,数据采集与监控)系统的核心设备。它的作用是能对现场各种信号进行数据采集、
随着互联网的快速发展,社交媒体、视频网络等多媒体数据成指数级增长。如何快速有效地获取用户所需要的多媒体信息,已经成为迫切需要解决的问题之一。在海量、高维的多媒体数
随着网络技术和流媒体技术的发展,通过国际互联网实时看电影、电视成为人们热衷的网上娱乐活动。C/S模式的流媒体服务系统存在着网络带宽瓶颈,不能满足大规模的流媒体服务需
油气藏和煤层等多孔介质,具有分形的特性,这主要是体现在油藏和煤层的渗透率分布、孔隙分布、渗流网络分布等。试井从狭义上讲,即是通过改变油、气、水井的工作制度,以引起油
视频监视技术是蕴涵巨大发展潜力的新兴科学研究领域之一,在轨道交通行业中,其应用日益广泛。本文在分析了轨道交通环境下的视频监视需求的基础上,给出了轨道交通车载视频监