基于q-gram的字符串相似性查询研究

来源 :现代计算机:上下旬 | 被引量 : 0次 | 上传用户:darkblueangel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相似性查询在实际应用中用途广泛,例如相似网页检测、相似图像检索、语言识别、数据清理等。而基于q-gram的字符串相似性查询作为主流方法之一.在查询的效率和灵活性上相对于其他方法都有很大的优势。实现基于q-gram的基本过滤器,并构成过滤器组合模型,用来过滤掉不匹配的字符串,得到候选集。实验结果表明,与传统的依靠编辑距离来比较每一对字符串的值相比,基于q-gram的过滤器能在保证相似性查询结果准确的前提下,在效率方面有显著的提升。
其他文献
嵌入式ARM产品对GUI设计的质量要求日益提高,本设计提供在ARM开发板上部署Qt/Embedded嵌入式环境的方法,详细描述Qt/Embedded的集成开发环境的配置过程、Qt的库文件Qt4.8的交
设计了一个用于6.2~9.4 GHz超宽带中国国家标准的接收机射频前端.通过采用共栅输入、电容交叉耦合的低噪声放大器和正交跨导级合并的折叠型混频器,实现了对UWB小信号的放大和
培养大学生的创新能力是当今教育的重要任务之一。计算机学科是一门不断创新的新兴学科,其特点决定了运用知识和能力进行创造性的实践有助于培养大学生的创新能力。开放实验室
VB和Lua都是常用的编程语言,为了结合利用VB和Lua各自的优点,快速、高效、灵活地进行应用程序开发,通过对C与Lua之间交互模式的研究分析,提出VB与Lua交互调用的方法,并进一步