【摘 要】
:
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标
论文部分内容阅读
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个处理阶段,其间利用了从人工标注的树库中统计得到的各种数据进行自动句法排歧,最终得到一棵最佳句法分析树,从而可以自顶向下地完成对一句句子的短语自动划分和标注,对一千多句句子的封闭测试结果表明,短语划分的正确率约为86%,短语标注的正确率约为92%,处理效果还是比较令人满意的。
其他文献
词表和分类法是传统纸质文献环境下最重要的知识组织工具。它的更新和维护一直依靠手工进行。这限制了它在数字图书馆和网络信息环境下的应用。本文介绍了一项基于统计的、从
运用拉格朗日建模方法建立了丝杠传动系统的动态模型,然后运用龙哥库塔方法结合具体参数对丝杠传动系统扭转振动进行了数值求解;将丝杠独立出来考虑,运用振动理论建立了丝杠
本文以上海印钞厂自动物流系统为例,详细地介绍了物流系统的物理结构,并通过对其具体流程的描述,体现了自动物流系统的强大功能和作用,强调了自动物流系统为现代化印钞行业所
将喷墨打印机,伺服定位系统,PLC组合成可移动喷墨打印系统,根据每次打印批次的不同,输入承印物的喷墨间隔、打印列数,由每次喷墨的图案数据参数,更改喷墨开关接通时间,构成承
教育隔离主要表现为学校隔离,在不同性质的学校就读的随迁子女之间就处于一种空间隔离的状态。调查发现,学校作为流动人口随迁子女社会化的主要场域,不同类型的学校蕴含了随
现代教育技术应用于高中数学课堂教学已经成为当今教育发展的趋势,也是新课程改革所大力提倡的。现代教育技术与数学教学的完美融合能将抽象、枯燥的理论知识具体化、形象化
通过对氨纶包芯纱特有的空芯、露芯、麻花纱、空鞘和弹性不匀等纱疵的成因分析 ,提出了相应的消除措施 ,即提高氨纶包芯纱的包覆效果、减少氨纶丝断头、减少外包纤维断头、合
今年3月以来,瓶装饮用水生产企业农夫山泉的"质量门"持续发酵。在公众的认知中,瓶装水应该比自来水更安全。然而,此次质量门曝露出来的真相却是,瓶装饮用水的国标中,水质指标
针对选择性激光烧结快速成形制造的需求,探讨并深入研究了振镜式激光扫描系统的组成,成形过程中线性扫描、图形畸变的校正、扫描系统机械滞后性的补偿、激光功率与扫描速度的