【摘 要】
:
通过机器学习等方法发现数据库系统用户的合法行为模式,并据此对用户提交的数据库请求实时进行检测是一种主动的深度防御机制。依据结构化查询语言(SQL)的语法结构和语义特性,设计了适用于组合攻击检测的SQL语句模型,并依据SQL操作对象的层次性,引入SQL操作泛化,给出了一种通用的基于SQL操作序列的用户行为模型。分析了引入SQL泛化后,BIDE算法位置拓展检验和BackScan剪枝判定的合理性,提出了
【机 构】
:
Institute of Information System and Engineering, School of Software, Tsinghua University, Beijing 10
论文部分内容阅读
通过机器学习等方法发现数据库系统用户的合法行为模式,并据此对用户提交的数据库请求实时进行检测是一种主动的深度防御机制。依据结构化查询语言(SQL)的语法结构和语义特性,设计了适用于组合攻击检测的SQL语句模型,并依据SQL操作对象的层次性,引入SQL操作泛化,给出了一种通用的基于SQL操作序列的用户行为模型。分析了引入SQL泛化后,BIDE算法位置拓展检验和BackScan剪枝判定的合理性,提出了面向SQL操作序列的多层频繁闭序列挖掘算法MLBIDE,使之能挖掘出更为完整的用户合法行为模式。最后,通过开源数据挖掘集EXTENDED BAKERY Dataset验证引入SQL泛化后算法能够挖掘更多的隐含序列,通过自定义的安全攻击实验验证了上述挖掘出的行为模式能够使入侵检测的准确率得到提升。
其他文献
研究了不确定图上的最短距离问题,提出了期望最短距离的概念,证明了该问题不存在多项式时间的算法。为了解决该问题,使用了随机采样技术获得不确定图的一些可能世界,在每个可能世界上计算有穷的最短距离,最后计算出平均值作为期望最短距离的估计值。为提高计算效率,使用了过滤条件来减少采样过程中采样的边数从而加快随机采样。在此基础上,提出了一种基于对称变量的、无偏的随机采样近似算法,并证明了与直接随机采样方法相比
作为多目标决策的重要手段之一,Skyline节点查询在传感器网络应用中发挥着非常重要的作用.文中深入地分析了Skyline节点查询的性质,提出了基于过滤的Skyline节点连续查询算法(FIlter based Skyline moniToring algorithm,FIST).FIST算法共包括自底向上、自顶向下和混合3种过滤方式,均通过在传感器节点设置本地或全局过滤器来避免不必要的数据传输,
由于RDF(Resource Description Framework)具有表达灵活、简洁等优点,已被接受为表达元数据及万维网上数据互联的规范。近年来,其数据量以飞快的速度增长,相应地,要求存储RDF数据的系统应具有高扩展性。大规模RDF数据库系统TripleBit旨在为大规模RDF数据提供一个高效的存储和查询方案。为尽可能降低存储空间消耗,采用了增量压缩和变长整数编码方法。并采用了数据分块的存
在Web方面搜索(faceted search)系统中,传统的逐步精化的搜索模式不再适用。针对Web数据的异构性和大规模特征,提出一种新的方面搜索模型:扩展式方面搜索。这种扩展搜索模式采用实体图来表示Web中实体的关联,针对在查询节点附近频繁共现的节点,高效地获取相关度较高的实体作为初始结果集;同时在迭代搜索中根据用户查询意图的变化动态地扩展或精化结果集,提供更为精确的方面列表来引导用户深入查询,
Hash连接是一种高效的连接算法。然而由于难以提前选择合适的桶数和散列函数,降低了Hash连接效率。该问题在列存储海量数据查询连接中,表现尤为明显。提出了一种基于桶内索引的Hash连接改进算法。该算法当某些桶内出现数据大量聚集时,以消除重复值和构建桶内索引的方式,大大减少查找匹配时间。进而,根据列存储特点,提出列值有序数据下的散列与匹配算法,进一步提升桶内查找速度。所做的改进在SSB数据集的实验结
复杂事件处理一般都是从大量的简单事件进行查找,整理出有价值的复合事件,在事件的查找过程中,强调的是事件的精确性匹配。本文提出了复合事件相似性查询,并且针对其定义,给出了两种剪枝策略。根据复合事件的特点,减少数据处理数量,降低I/O代价。最后,利用实验对提出的两种剪枝策略进行对比分析。
相互最近邻查询(MNN)在决策支持、数据挖掘和模式识别等方面有着重要的应用价值。然而,在实际应用中,用户可能仅仅对某一受限区域内的相互最近邻感兴趣。鉴于此,引入了受限相互最近邻查询(CMNN),以找到所有位于指定受限区域内的相互最近邻;并提出了一种高效的基于重用的受限相互最近邻查询(RCMNN)算法。真实与合成数据集上的大量实验评估证实了RCMNN算法的有效性和扩展性。
移动对象数据库系统中存放着大量的关于移动对象位置信息的时空轨迹数据,受到主客观因素的影响,移动对象运行行为具有动态性、不确定性和实时性的特点,需要不断更新位置信息.为了支持对不确定性移动对象过去及当前位置的查询,必须提供更加有效和高效的索引结构.提出了新型索引方法HNTR-tree,对静态路网信息采用R*-tree索引管理,对实时更新的移动对象运动轨迹采用节点更新代价较小的R-tree进行索引,并
网页信息抽取旨在从网页中抽取出结构化信息,网页中不仅仅包含由自然语言构成的自由文本,同时也包含如表格、列表等半结构化文本,之前相关研究大多仅针对单种文本进行抽取,提出了一种同时从自由文本和半结构化文本中抽取信息的综合方法。采用启发式规则,从页面中筛选出自由文本和半结构化文本,之后针对自由文本采用分词、词性标注、命名实体识别等自然语言处理技术和基于规则进行信息抽取,同时采用包装器归纳的方法归纳出单槽
随着定位技术在很多领域的应用,越来越多的应用系统服务器中开始存储大量的定位数据,而如何对这些定位数据进行聚类分析日益成为一个研究热点。针对以轨迹片段表示轨迹局部特征存在的问题,引入了以轨迹点表示轨迹局部特征的思想,并在局部位置无关概念的基础上,提出了一种有效的轨迹片段聚类算法。该算法利用R-Tree和局部位置无关的角度快速找出代表性轨迹点,并进一步获得轨迹片段聚类。实验结果也表明该算法比现有流行算