一种新颖的词性标注模型

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:yyy8881200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章首次提出一种统计模型,即马氏族模型,该模型假定一个词出现概率既与当前词的词性标记有关,也与它前面的词有关,但其前面的词和该词词性标记关于该词条件独立.将马氏族模型适当加以简化,能成功地用于词性标记,实验结果证明:在相同的测试条件下,这种基于马氏族模型的词性标注方法标记成功率大大高于传统的基于隐马尔可夫模型的词性标注方法.马氏族模型在其它一些自然语言处理领域如分词、句法分析、语音识别、机器翻译也有广泛的应用前景.
其他文献
网络流量的测量是流量矩阵估算数据来源的基础。在全面总结了当前的流量测量技术的基础上.从流量矩阵估算的角度提出了一种流量测量模型,引入了适用于流量矩阵估算的测量服务和
为提高遗传算法的优化性能,构建了交叉及变异算子的模糊动态调整器,给出了参数调整过程、模糊逻辑控制器的执行策略及控制过程.采用标准的Benchmark测试函数比较了模糊控制器
缺血性心脏病是一类严重威胁人类健康的疾患,其发生、发展和预后与血管内皮密切相关.研究发现内皮祖细胞也参与出生后的内皮修复和血管新生过程,提示其在缺血性心脏病中的重
蚂蚁算法是一种新型随机优化算法,能有效解决Ad Hoc网络多约束的QoS路由问题,但存在收敛速度慢和易陷入局部最优等缺点.针对于此,在借鉴精英策略的基础上提出了一种基于双向
<正>建筑与人类共生,与文明相伴。人们对美好建筑的向往,是建筑师和结构工程师孜孜不倦的追求。随着时代的不断发展,建筑物的功能也日趋多样化和复杂化,结构工程师需要深刻思
HRS(Heart Rhythm Society)第25届科学年会于2004年5月19~22日在美国旧金山举行.心脏再同步化治疗心力衰竭是本次会议的热点,下面就其中的精彩内容作一介绍:
Access Grid通常被称作访问网格,它是一种以开放网格服务体系结构(OGSA)为基础的,结合视频会议技术、网络技术和网格技术,建立起来的群组可视化交流环境.文章首先介绍了Acces
低密度脂蛋白的氧化修饰是形成动脉粥样硬化的基本条件,胆红素具有抗低密度脂蛋白氧化修饰的作用.胆红素降低是新发现的类似于吸烟等的冠心病危险因素.
水通道蛋白2是1993年被克隆确认的水通道蛋白家族中的一种,位于肾脏集合管主细胞管腔侧和靠近管腔侧的囊泡内,是血管加压素依赖性水通道,是调节肾脏集合管对水通性的关键蛋白
文章对于离散多音DMT(Discrete Multitone)系统中量化噪声和削波噪声进行了详细的分析,提出了DMT系统中进行削波率最优设计的原则和方法.仿真结果显示经过不同准则的削波率优