编辑距离算法相关论文
为了满足人们与教育机器人的智能对话,设计实现了基于教育机器人的QA系统.重点阐述了QA系统中中文匹配的算法——基于分词的编辑距......
随着互联网信息的爆炸性增长,搜索引擎已成为人们从海量数据中获取信息的一个重要途径。目前搜索引擎主要还停留在关键词匹配的基础......
随着大数据时代和人工智能领域的发展,数据的存储和挖掘处理凸显的愈加重要,同时出现了数据质量降低的问题。数据清洗能够有效处理......
动态手势识别是人工智能一个重要的领域,在虚拟现实,聋哑人交流,机器人控制等方面均有广泛的应用前景。近年来,随着集成技术的高速......
针对外星语字母词根快速查找的问题,提出了外星语字母词根查找模型,该模型的具体方法是基于编辑距离模糊匹配和KMP算法的综合算法.......
文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本......
随着计算机网络技术的发展,检索成为互联网中一项重要的技术。字符串搜索系统允许用户提供一段字符串作为查询条件,系统将查询条件中......
描述网络教学的数据仓库中包含了从各种数据源导入的大量数据,数据的质量问题会直接影响教学评价的效果。针对学生重复信息的处理,......
通过分析编辑距离算法的不足,采用数据结构的方法优化该算法的空间和时间复杂度,采用中文分词、同义词和基于短句的方法优化该算法......
通过分析编辑距离算法的不足,采用数据结构的方法优化该算法的空间和时间复杂度,采用中文分词、同义词和基于短句的方法优化该算法......
为了从不同的文本获取干净、有效的信息,首先要做的是删除重复的内容,而问题的核心是字段的匹配。目前大部分的字段匹配算法主要针......
根据企业信息化建设的现状,阐述了编辑距离算法在数据清理中的重要作用。在分析了编辑距离算法原理的基础上,用Java程序实现了编辑距......
考试系统是检验地铁员工业务水平的重要工具,目前大多数考试系统均以预先设置的题库为基础,维护题库需要消耗大量的人力成本,且题......
数据集中规范的数据总是存在与其相似的其他数据。越是庞大的数据集,其中满足规范性要求的个体是相对集中的,而且这些满足规范性的......
目的建立听似药品智能化筛选方法,为优化管理提供量化依据。方法基于编辑距离算法理论,从汉字和拼音相似性角度出发,对药品的相似......
通过对科研基金名称数据特点和文本数据聚类方法的分析,提出并实现了基于编辑距离算法(Levenshtein Distance)的科研基金名称数据分析......
随着文本信息处理技术的发展和用户对该技术的需求的提高,很多人希望在错误拼写维吾尔语文本或维吾尔语词语的时候,以由系统自动分......
在跨国电子商务环境下,一些以电子商务为依托的快递企业的业务拥有了自己独特的特点,其入库作业不仅仅包括了商品接运、商品入库的......
编辑距离算法又称Levenshtein距离,是一种将一个复杂的最优解问题分解成一系列较为简单的最优解问题,再将较为简单的的最优解问题......
为了自动智能检测出新变种的恶意程序,使用虚拟执行与应用程序接口钩子技术,分析程序执行中调用的系统接口,将接口调用顺序编码形......