一种基于Bigram二级哈希的中文索引结构

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:zzhijian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为通过构建高速的中文索引结构来提高Off-line模式的串匹配速度,提出了一种基于Bigram二级哈希的中文索引结构。该索引采用中文GB2312编码处理中文汉字,以中文Bigram项作为词汇项,并实现了基于二级哈希的词汇表存储结构。实验数据显示,本文索引结构虽然占用存储空间为词索引的2倍多,但其匹配速度是词索引的4倍多。结果表明本文索引在中文匹配中具有速度优势。
其他文献
图像分割的对图像识别、分析与理解具有重要的作用。文中针对含有噪声的图像,提出了一种分段点乘的图像分割算法。具体方法是首先根据灰度直方图确定图像的多灰度区域,然后实施分段点乘运算,使得图像中暗的部分更暗、亮的部分更亮,提高了目标和背景的对比度,突显了目标。最后用Canny算子进行边缘线分割,得到了较好的分割效果。该方法思路清晰,容易实现,具有较强的实用价值。
目的建立糖皮质激素所致阿尔茨海默病模型,观察胰岛素抵抗大鼠海马β?淀粉样蛋白42(Aβ42)的表达及对大鼠学习记忆的影响,探讨胰岛素抵抗在糖皮质激素所致阿尔茨海默病(AD)发病机
Galileo卫星导航系统当前处于在轨验证阶段,对在轨验证卫星性能的分析能洞察Galileo系统的性能。本文从信噪比、伪距多路径误差和单点定位精度等方面进行分析并同GPS卫星进行
目的 探讨黛力新联合心理干预对丘脑梗死后合并抑郁焦虑症状的治疗效果。方法 采用自评抑郁量表(SDS)、自评焦虑量表(SAS)对140例丘脑梗死患者进行评分及测定,并对合并焦虑抑郁的
为了解决云资源分配过程中虚拟机通信距离较大,造成用户计算任务完成时间延长问题,提出一种最短通信距离的虚拟机分配算法。云资源管理器能够根据用户指定的虚拟机条件,将计
西方人眼中的俄罗斯是什么样的?英国《每日电讯报》列举了数十种在西方人看来很“惊奇”的俄罗斯社会现象:俄罗斯地铁的秘密、无处不在的衣帽间、送花的讲究……  1. 在俄罗斯最大的博物馆——埃尔米塔日博物馆里有一群由70只猫组成的保安队,负责保护博物馆的珍宝。这一传统始自彼得大帝的女儿、伊丽莎白女皇时代。  2. “革命广场”地铁站有一尊鼻子被人摸得锃亮的狗铜像——因為摸一下它就会心想事成。  3. 莫
目的 观察精准微创显微手术治疗高血压脑出血的临床疗效。方法 回顾我科2012-06—2015-08收治的资料完整的高血压脑出血患者76例,40例采用精准微创显微手术颅内血肿清除术为
为了自动挖掘新闻字幕中人名与新闻人脸图像之间的一一对应关系,提出基于多类SVM的新闻政要人物自动标识方法。首先,针对每个人名,找到相应的图像集;其次,将人脸检测算法应用于图像集,检测出所有的人脸图像。为了减少计算量及提高聚类的准确率,将人脸图像分成两组图像。对第一组人脸图像进行聚类,聚类中最大类的人脸图像作为该人名的初始训练样本,对于其他人名,使用相似的方法找到初始训练样本;为了改善训练样本的可靠
合同管理是企业业务流程的始点和终点,贯穿于企业内部业务展开的全过程,运用合同管理信息系统可以提高办公效率和质量.针对合同管理信息系统开发的难点问题,本文在阐明数据库
儒家心性修养理论对传统气功、武术学产生过较大影响,这是一种在静中验证“心体”和宇宙的学问,与一般的哲学有所不同。从实际修习的角度,对儒学一系列的静修心法做了疏通和探索