基于动态规划的缩写发现算法

来源 :武汉大学学报:工学版 | 被引量 : 0次 | 上传用户:zoec
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据清理中重复记录的识别一般采用动态规划算法或过滤算法,然而很少算法考虑了数据中的缩写问题,因此容易漏掉一些重复记录,影响了数据清理的质量,因此在动态规划的基础上提出了缩写发现算法,同已有算法相比,它的算法复杂度较小,而且能够发现汉语等无分隔符的语言中的缩写,最后给出了缩写情况下判断字符串近似匹配的方法.
其他文献
分析了Access数据库OLE对象的特点,并给出了在Delphi环境下实际实现OLE对象的保存、打开与显示的处理方法.
补偿收缩混凝土中掺入不同量的纳米SiO2进行抗硫酸盐侵蚀试验,并对其抗压强度和劈裂抗拉强度进行了测定,分析了纳米SiO2掺量对补偿收缩混凝土受硫酸盐侵蚀后压拉性能的影响。
<正> 利用气相色谱的检测技术,进行薏苡仁油脂脂肪酸研究。结果发现,薏苡仁油脂含有棕榈酸(C16:0),油酸(C18:1)亚油酸(C18:2)、亚麻酸(C18:3)、廿碳烯酸(C20:1)成份。油脂中
期刊
2020年3月15日,3家上市公司(雅本化学、泰和科技和秀强股份)均披露其因涉嫌"误导性陈述"被证监会立案调查。而3家上市公司涉嫌"误导性陈述"的具体原因均系其在投资者互动平台
任何企业在实际生产建设中都具有周期性,需要对于材料不断进行购买与销售。在材料购买的过程中使用科学的管理模式,是降低企业经济成本的有效途径,增加企业在市场中的竞争力,
目前,安达斯集团参评的“RiedelMediorNet多媒体光传输设备”夺得了播映、传输与新媒体组别产品奖。安达斯此次获奖的产品是德国Riedel通讯集团公司研制的MediorNet多媒体光传
改革开放以来,我国的经济和科学技术迅速发展。目前,在民用、军事和科学领域等诸多方面,无人驾驶智能车得到了广泛的应用,前景广阔。在无人驾驶智能车上安装远程监控系统,它
目的研究桃红四物汤有效成分体内作用的物质基础。方法利用液相色谱-串联质谱(liquid chromatography technique coupled with tandem mass spectrometry,LC-MS/MS)提供的色
建立了伸缩杆支架的力学模型,重点分析了水平加载和偏心加载条件下支架各部件的受力状况,提出了各结构件的强度验算准则,为支架设计计算和型式试验提供了理论依据和可行方法
<正>编辑观点:特有的"天窗"创新设计以及优秀的散热,加之不错的防尘能力,成为主流电脑的极佳选择。体验感受:双胞胎,有不同在这之前我们介绍过速冷8219机箱,采用的是黑色光面