【摘 要】
:
信息熵是信息论中用于度量随机变量的不确定性.自然语言信息熵的估计是自然语言信息处理中非常重要而且基本的问题.在试验中,使用统计的方法对250多万词的维吾尔语语料库文本
论文部分内容阅读
信息熵是信息论中用于度量随机变量的不确定性.自然语言信息熵的估计是自然语言信息处理中非常重要而且基本的问题.在试验中,使用统计的方法对250多万词的维吾尔语语料库文本进行统计,初步计算了维吾尔文的信息熵和多余度.所求得的信息熵和多余度分别为4.387比特和13%,相当接近了其它拼音文字的信息熵和多余度.
其他文献
以邯邢矿山局的信息化建设为实例,描述了矿山企业信息化建设对企业实现战略目标、加强管理、提高经济效益的作用.
目的研究应激障碍患者血浆皮质醇、生长激素、泌乳素和白细胞介素(IL)2,6,8与正常个体的差异。方法于河北省张北尚义发生里氏62级地震后3个月,在当地选取因地震导致的创伤后
本文分析了残采区老塘、老硐充水原因,提出了上行布置工作面、缩小工作面垂高、下机巷布置泄水眼、上微倾回采等防治水害的技术措施.实践表明,采用这套措施效果良好,这可为今
古近系沙河街组沙三段下部发育的深湖相油页岩是东营凹陷最重要的优质烃源岩.该油页岩呈深灰色或棕褐色,页理发育,主要由富含有机质纹层和浅灰色钙质纹层形成的毫米级沉积层
柴达木盆地西部原油为盐湖相未成熟-低成熟原油,属于典型的原油成因类型.尕斯库勒油田是柴达木盆地西部最大的油田.从油气生成运移、聚集成藏诸方面,较为系统地研究了该油田
分析研究了兰州台前兆仪器在甘肃省岷县Ms5.2地震前后的观测资料,发现形变学科的CZB-1型竖直摆倾斜仪、SSY-Ⅱ石英伸缩仪,流体学科的SZW-1A型数字式温度计,电磁学科的ZD8B地
在构建社会主义和谐社会的和谐氛围中,新闻媒体肩负着义不容辞的协调重任.本文就新闻媒体角色认知的准确与否,提出了用正确的人生观、价值观去影响群众、引导群众,充分发挥社
对于地下工程来说,围岩的长期抗剪强度从来是工程设计者和研究者所关心的课题.但历来仅根据持续时间十分有限的试验来确定.因此从某种意义上说,由这类试验所得到的,并非真正
总结分析了近年来我国煤矿水害事故发生发展的基本规律与特点,从矿井水文地质条件、煤矿生产方式与管理方式、现有的矿井防治水技术及其应用等不同方面,阐述了造成这一水害特
天然气的成藏过程是指天然气从源岩排出后的运移、聚集和散失过程,这一过程的有效性可以用气藏成藏保存阶段单位圈闭面积内的充注速率与散失速率的差值,即天然气净聚集速率定