【摘 要】
:
该文引入上下文词、搭配两种特征作为约束,利用最大熵原理构建查错模型,以期解决词语搭配不当、长距离的语言限制等词一级的错误.基本思想是,构建词语y在上下文x上出现的条件
论文部分内容阅读
该文引入上下文词、搭配两种特征作为约束,利用最大熵原理构建查错模型,以期解决词语搭配不当、长距离的语言限制等词一级的错误.基本思想是,构建词语y在上下文x上出现的条件概率分布模型p(y|x),查错时根据句子中的上下文x计算y出现的条件概率p(y|x)和y不出现的条件概率p(-y|x).如果p(y|x)≥p(-y|x),则y无误;反之,y有错.该文构造了用于验证该文提出的查错方法的有效性和实验系统,实验结果获得了80﹪以上的招回率和50﹪以上的准确率.
其他文献
从视频帧和彩色图像中进行文字侦测和识别是一个特殊的研究范畴,并且有着它自己的一套方法,对这个方向中涉及的一些具有挑战性的问题正在获得广泛的研究,并且也因为这项研究
该文围绕着基于XML的Web查询技术涉及到的主要问题展开研究与讨论,首先针对Web上数据格式差异大、数据来源判别大及当前的数据模型不能很好的描述Web上数据的缺点,研究和探讨
物流是因人们的商品交易行为而形成的物质从供应者向需求者的物理性移动.配送是物流过程中一个主要环节,其运营成本占整个物流成本的大部分.配送中的车辆路由问题,是现代物流
为了缩短国内制造业在现有生产模式下的产品开发周期,围绕资源的合理化利用、工艺的快速动态设计、工艺路线的制定等问题,结合长春第一汽车制造厂在产品设计的计算机工艺辅助
作为信息隐藏技术的一个主要分支,数字水印技术已逐渐成为保护数字产品版权的重要手段,得到了广泛的研究和应用.该文首先简要介绍了现代信息隐藏技术的产生背景、研究内容、
"公安WEB综合查询系统"是某市地市级"公安综合信息系统"的重要组成部分,该文所述的"公安WEB综合查询系统"是在体系结构上具有典型代表性的WEB系统.目前该系统已在公安机关投
自互联网出现以来,网络信息每天都在快速增加这些信息既包括传统形式的网页内容电子文档以及图片视频音频等多媒体文件,也包括现在广泛流行的微博社交网站移动应用软件APP等,它
互联网业务发展迅速,现有的互联网协议IPv4已无法适应时代的要求.IP网络将向着IPv6的方向发展,提供可靠的网络服务并保证服务质量是未来IPv6网络需要解决的关键问题.该文首先
该文在介绍了数据挖掘的主要分析方法和处理过程模型后,将数据挖掘方法与入侵检测系统相结合,构建了一种基于元数据挖掘的分布式入侵检测系统模型,提出桥方法,解决了不兼容的
支持向量机(简称SVM)是一种新型机器学习方法,由于其出色的学习性能,该技术已成为当前国际机器学习界的研究热点。支持向量函数回归(简称SVR)是SVM的一个重要分支,它已经成功的