中文词组的快速查找算法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:shakekele
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出按数据文件的关键字(中文词组)中每个汉字笔划数的权值之和进行分桶存贮,在查找中文词组串时,也采取按桶检索的查找算法,并证明了该查找算法的平均化费为O(N),优O(N log N)于的二分查找算法。
其他文献
本文提出了基于键盘的字词输入技术之上的语句输入的思想,讨论了拼音语句输入的知识的表达、获取和系统实现,给出了测试结果及应用情况。
一、案件事实与处理经过1995年8月17日,陕西省榆林市某煤矿两名同志到长庆石油物探处2117队驻地,以该处2117队1995年7月23日地震勘探施工造成煤矿通风井渗水增大,影响生产为
期刊
标准词库是机内自动识别重码和词码输入方式的重要数据基,但词库庞大,微机内存有限,使词库不能全部装入内存使用。本文介绍无编码通用词库的高倍逻辑压缩技术,可使词库全部装入内
数学教育是学生今后发展的重要学校课程教育之一,在目前不断深入的课程教学改革背景下,小学数学的新课程教学应如何创新,以更有利于学生今后的发展呢?本文从教学意识创新、教
本文通过对传统的自然语言处理方法的分析,针对自然查询语言的结.构,提出了一种基于结构分析的语言模型——CDSA(Concept Dependence onStructure Analysis)模型,并描述了作
本文提出了一种改进的最大匹配的自动分词方法,并给出了相应的算法及词典设计。
本文首先谁了利用西文键盘的汉字输入,完全根据汉字的音,形或意等属性编码,很难达到最优。因而,我们提出既利用汉字的某些属性编码。同时又强制固定汉字的一些编码,使得编码位数达
本文采用Shannon理论,讨论了古籍印刷汉字识别字域地选择所受的约束,汉字特征提取的性能限度,以及如何用汉字的统计特性,进一步提高系统的识别率。在理论分析的基础上,经过大量实验研究,所
本文介绍了一种智能计算机辅助中文教学系统。作者为系统引入了一种基于规则的自然语言形式文法,使系统具备了文法分析功能及自然语言的理解能力。以基于规则的文法为基础建
随着社会主义新农村建设的深入开展,村务公开民主管理工作也越来越重要,只有把村务公开民主管理贯穿于新农村建设的整个过程和所有领域,才能稳步推进农村经济建设、政治建设、文