Katz平滑算法在中文分词系统中的应用

来源 :计算机工程 | 被引量 : 0次 | 上传用户:ccc1A2B3C
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对基于统计模型的中文分词系统,从系统实现的角度探讨了主流的相关技术,涉及:n—gram语言模型,语科库,统计模型的参数估计及参数平滑等概念,重点对Katz平滑算法作了改进。片在分词系统原型中实现了该算法。
其他文献
在开发桌面视频会议系统的过程中,利用Windows Socket规范实现了视频,音频在网络上的实时多点播送,首先描述了Gd DCS系统多点播送的模型,然后讨论视频,音频实时多点传输的实现。
随着经济条件的改善,人们期望通过个人努力来达到自我完善。要实现高层次、高品质的精神追求,靠一次性的学校教育是难于达到的,因此终身教育已成为多数人的迫切需求。高校博
对开发中小型企业网络管理系统的可能性进行了介绍,并提出了两种具体的实现方法.
通过分析新一代互联网地图服务平台ArcIMS3.1 的特点及其体系构架,探讨其优于Map Object IMS之处,基于ArcIMS3.1平台并结合Japplet技术、JSP技术等,提出一种新的具有多层结构的WebGIS方案,并在工程项目中得到成功的应用, 这对于开展WebGIS领域的研究和应用有较大的实用价值。
介绍了烟草企业销售主题数据仓库的构建方法和运用数据挖掘技术深入进行客户分析、市场分析、产品分析、促销分析、预警分析的思路,论述烟草企业运用数据挖掘技术,提高企业信
本研究的目的是比较刈割频率和施氮水平对三个不同的牛仔草品种——Bigalta牛仔草、Redalta牛仔草和Floralta牛仔草的季节产量和品质的反应。实验结果表明牛仔草可以产生大量
提出一种曲线跟踪真充算法测量复杂网络的长度,在对曲线上的象素填充时,分类统计象素的总数,最后计算曲线的长度。本算法速度快、精度高、效率高,不受网络复杂度的限制。
本文阐述了用双样方检验法(double-sampling)测定牧草产量。采用了三种方法测定牧草高度,并估测牧草产量与高度之间的关系。这三种方法都具有相似的曲线关系,其中最佳者方差
<正> 牧草青贮因各地条件不同而方法各异,目前比较成熟的青贮形式以窑贮、塔贮、地面堆贮和塑料袋贮为主。80年代中期在英国又新起了把园草捆用塑料薄膜包裹青贮的新技术,由
一遇到鼻出血,90%的人第一反应就是仰头止血,接着用卫生纸塞住鼻孔。这么做了以后,似乎鼻血确实止住了,可绝大多数人并不知道,这个习惯性处理方法并不科学,甚至可能危及生命