树编辑距离相关论文
为了给C语言编程题进行合理评分,本文提出了一种新型的自动评分方法,在动态检测阶段先利用KMP算法执行关键字匹配,若匹配相似度落......
动态网页是Internet上重要的网页类型,它们通常是由网站的后台数据库通过某种通用的模板构成.如何从动态网页中抽取信息有着十分重......
随着互联网的高速发展和搜索引擎的出现,人们从互联网上获取信息比以往任何时候都变得快捷和高效。随着各种应用的丰富,越来越多的数......
校园网络不断快速发展,己成为反映大学生思想道德健康的一个重要窗口。从校园网络BBS、博客中检测大学生乐于讨论的话题和事件是掌......
数据库技术是当今信息处理的基本手段,数据库课程是国内高校计算机专业学生必修的专业基础课程,数据库课程建设的好坏直接影响到培......
近年来,随着在线考试系统的推广和流行,针对计算机自动评分技术的应用研究已迅速地发展并成熟起来。但是,目前大多数的在线考试系......
随着国际互联网的迅猛发展,网络已经成为人们发布和获取信息的一个重要平台。目前,大部分网页都是通过服务器根据请求从后台数据库......
随着互联网的高速发展,Internet在我们日常的生活中扮演越来越重要的角色,成为我们生活和工作中必不可少的一部分。网络的高速发展......
探讨把相似网页转化成标签树,引入树编辑距离的概念,利用树匹配算法来量化网页结构相似度。把该算法应用于Web信息抽取,采用树的相似......
参数污染攻击检测技术逐渐成为了Web应用安全领域研究和讨论的热点。本文从分析参数污染攻击的方式入手,研究了利用该漏洞实施......
虽然网页设计者一般将相关内容放在同一页面,但是网页通常包含如广告、导航栏、版权信息等与页面主题关系不大的信息,同时也可能包......
为了识别犯罪嫌疑人伪造和篡改的虚假身份,利用树编辑距离计算个体属性相似性,证明了树编辑距离的相关数学性质,对属性应用层次编......
本文提出了一种利用树编辑距离和AESA算法进行手写体数字识别的方法,该方法的识别效果接近基于神经网络和支持向量机的手写体数字......
针对Web中数据密集型的动态页面,文本数据少,网页结构化程度高的特点,介绍了一种基于HTML结构的web信息提取方法。该方法先将去噪......
提出一种改进的树匹配算法,通过考量HTML特性,对树编辑距离方法进行改进,根据不同HTML树结点在浏览器中所显示的相关数据的不同权重赋......
针对数据库机器学习过程中的存储过程评估问题,提出基于AST的存储过程自动评估模型。从静态评估的角度,给出了模型的整体框架;以构......
XML类型的数据成为当前主流的数据形式,本文提出一种检测XML数据相似性的方法,即将XML文档转换成树结构的基础上,对树结构的节点加权,......
针对SQL语言编程能力评估的多因素影响、界限模糊特性造成的难度和偏差问题,本文提出了基于结构相似度匹配的评估模型(SQL-APAM)。结......
Web信息抽取中需要对目标网站的网页进行聚类分析,以检测并生成信息抽取所需的模板。传统的基于DOM树编辑距离的网页聚类算法不适......
在工作流的发现和聚类等应用中,需要对两个工作流模型的距离进行度量。因此,提出一种计算两个不同结构化工作流的距离定量度量方法......
利用树大小和树编辑距离的简单函数提出了一种归一化树编辑距离,在权重函数具有度量性质且所有插入和删除操作的权重都相等时,不仅......
以SQL预编译的构建为目的,提出一种基于ANTLR(Another Tool for Language Recognition)的SQL预编译设计模型。模型从编译原理的角......
Div+CSS流行于Web页面的布局,在这种布局下,网页中很多数据记录以重复结构的形式聚集在一个层级。为了更好地从网页中挖掘数据,提......
介绍基于网站和网页结构的信息采集算法,提出一种基于约束树编辑距离的导航树算法。该算法通过提取网页的HTML的重要标记生成网页结......
本文研究了如何从列表页面中抽取数据记录.系统分为两个阶段:第一步采用三种启发式方法相结合的方法.识别主数据区域的根节点;第二步将......
树形结构的文本配置在分布式的测控数据处理软件中使用广泛,它的正确性对数据处理而言至关重要。为了实现树形结构的文本配置自动......
动态网页是Internet上重要的网页类型,它们通常是由网站的后台数据库通过某种通用的模板构成。提出了一种新的基于树模型算法的动......
处于电力系统末端的配电网,履行着电能分配的职责,直接影响用户供电可靠性和供电质量,是灵活互动智能用电的实现地,具有拓扑结构多......
已有的拓扑相似性度量方法主要通过目标之间拓扑关系统计均值的差值,衡量目标之间的拓扑相似程度,在拓扑变化复杂区域由于拓扑关系......
有向标记根树之间的编辑距离(TED)被广泛应用在文档的结构化相似度计算上.文中提出有向标记根树之间的语义编辑距离(TSED)的概念,......