最小编辑距离相关论文
随着信息化、智能化社会的高速发展中,业务流程管理的作用越来越突出,一个性能优越的业务流程模型可显著提高公司系统的工作效率,......
网络信息的海量增加使得信息检索成为信息获取的重要途径,但是,传统的基于关键词在很多场合下并不能满足日益增长的各种信息获取的......
本文针对蒙古文文本词级错误,借鉴其他语言成功的校对方法,实现了具有词形非词纠错建议自动生成功能的文本校对系统。本文由导论、......
基于视频的动词语义习得模型,简称ViMac-V系统,是一种自然语言生成系统。ViMac-V首先在学习阶段从双通道语料中习得动词框架和各成......
最小编辑距离以其良好的抗噪性成为机器学习算法特征比对的重要手段。但是最小编辑距离经典算法时空复杂度均为O(n×m),较高的时空......
在哈萨克语文本非词查错方面,归纳和总结查错方法,在一定规模的哈萨克语词库的支持下,利用哈萨克语的特点,用哈萨克语词干切分程序......
拼写错误的发现和候选词选取是文本分析中的一个重要的技术问题。本文结合维吾尔语的语音和词语结构特点,列出了文本中常见的拼写错......
本文提出了一种生物医药领域词变体的识别策略。首先使用最小编辑距离算法和字符匹配算法从语料中分别获得特定目标词的形态学变体......
结合网络上流通的拉丁化维吾尔文字特征,以拉丁化维吾尔文单词作为研究单位,首先,通过大规模文本语料库建立了固定词库、词首字母......
对生活中涌现的海量语音数据需要进行快速而准确的检索.提出一种基于动态匹配词格检索的关键词检测方法,应用TRAP特征和多层感知器创......
根据拉丁维文的特点,分析了拉丁维文常见的拼写错误类型,提出了一种将最小编辑距离、基于有向图模型的词语切分和trigram语言模型融......
论文提出一种有限分隔最长公共子串算法,将这种算法与改进的最小编辑距离算法相结合实现输入单词与词库内单词的相似度计算。最终......
在哈萨克语文本非词查错方面,归纳和总结查错方法,在一定规模的哈萨克语词库的支持下,利用哈萨克语的特点,用哈萨克语词干切分程序......
该文使用熵模型来对中英文双语语料进行人名对齐。熵模型综合利用双语人名词典、双语姓氏词典、词汇对齐概率、中英文人名的共现特......
在基于动态匹配词格检索(DMLS)的关键词检测系统中,应用最小编辑距离作为关键词检出的置信度,在提高检出率的同时也增加虚警率。针对此......
利用机器视觉技术完成生产线上工件的检测与识别,能够有效地提高制造中的柔性化与智能化水平。目标识别与定位作为机器视觉的一个......
飞机维修人员在录入工作时,往往由于输入速度慢,输入数据不准确降低了工作效率,本文提出一种利用余弦相似度和最小编辑距离的文本......
针对用户使用搜索引擎输入关键词查询信息时,由于输入法的原因或者不小心输入错误关键词等,致使搜索结果不符合用户预期的问题,提......
结合网络上流通的拉丁化维吾尔文字特征,以拉丁化维吾尔文单词作为研究单位,首先,通过大规模文本语料库建立了固定词库、词首字母......
<正>《自然语言处理综论》(第二版)由电子工业出版社2018年3月出版。原作者:Daniel Jurafsky(D.朱夫斯凯),James H.Martin(J.H.马......
期刊
在过去的几十年间,邮件自动分拣系统已经在中国得到广泛的应用,其中分拣技术已经从基于邮编识别发展到基于地址识别。然而,使用识......
随着文本信息处理技术的发展和用户对该技术的需求的提高,很多人希望在错误拼写维吾尔语文本或维吾尔语词语的时候,以由系统自动分......
随着联机手写识别精度的不断提高,识别算法的复杂度也随之上升。然而,就算是目前识别性能最好的卷积神经网络模型,在识别某些用户......