开发中文搜索引擎汉语处理的关键技术

来源 :计算机工程 | 被引量 : 0次 | 上传用户:sunx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论述了开发中文搜索引擎语言方面的两项关键技术,即中文分词技术和汉化问题,介绍了几种解决方案,并在结尾展望了中文搜索引擎的未来。
其他文献
传统乐观并发控制方法对工程设计事务支持较弱。该文以嵌套事务模型为基础并结合检入=检出机制,提出一种改进的乐观并发控制方法,能够较好地解决传统乐观并发控制方法在工程设计
乌拉尔甘草、刺毛甘草、光果甘草、胀果甘草、刺果甘草等5种甘草从资源分布在医药、畜牧、食品、化工领域的应用等方面的研究进行了综述,对甘草的进一步开发利用提供了科学依据
提出一种基于混沌的序列密码生成方法,该方法通过随机改变混沌映射的参数来提高混沌的复杂性.同时在有限精度实现时,通过引入扰动序列使得输出的混沌序列具有良好的自相关性
介绍了一种NAT的形式化模型,讨论了NAT在FreeBSD上的实现以及NAT模型在实际编码中的一些应用,解释了一些NAT理解上的误区,并说明了该模型在实现上的意义.
论述了关于安全防爆问题的"本安控制系统"和"隔爆控制系统",同时讨论了将温度变送器和安全栅合为-体的新型隔离式安全栅.提高了产品的性价比.
介绍了一种基于Windows DNA架构的远程网站备份与恢复技术,可以在远程方便地对网站的文件和数据进行备份与恢复,而且备份的文件与数据都可以安全地下载到本地保存.还介绍了该
现代博物馆智能展示信息系统的关键在于实现联网计算机设备的移动性和便携性,以获取和下载有效信息.该文采用最新无线局域网和DSP技术,提出基于移动数据点播策略及技术组态,
空间信息系统的数据体系需要维护空间数据的现势性和有效性,文章讨论了一种在局域网上远程动态修改分布存储的空间数据的方法,可以在一定程度上解决这一问题。
2001年3~6月在浙江横店地区调查观察到草坪杂草常以禾本科为主.通过化学防除杂草试验证明:苗前用除草剂以横店7号和绿麦隆为最佳试剂;防除双子叶杂草以2,4-D丁酯和二甲四氯为
对天祝高寒地区芜菁品种—洋芜菁和平芜菁在叶丛迅速生长期进行了光合日动态研究,结果表明:叶片周围微环境的相对湿度和光合有效辐射对叶片净光合速率影响较大,其作用强于其