基于最大熵方法的汉语词性标注

来源 :计算机应用 | 被引量 : 32次 | 上传用户:sysbot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最大熵模型的应用研究在自然语言处理领域中受到关注 ,文中利用语料库中词性标注的上下文信息建立基于最大熵方法的汉语词性系统。研究的重点在于其特征的选取 ,因为汉语不同于其它语言 ,有其特殊性 ,所以特征的选取上与英语有差别。实验结果证明该模型是有效的 ,词性标注正确率达到 97.34%。
其他文献
在信息化快速推进的今天,网络技术发展日新月异,网络应用越来越广泛,日益受到人们的重视。政府、军队的核心机密和重数据、企业的商业机密、个人重信息都存储在网络计算机中,保证
在信息化高速发展的社会背景下,信息技术的掌握程度对学生发展尤为重要,因此作为一名有经验的教师要结合时下先进的教学方法,开展课程教学。文章对微课的相关概念进行了简述,
产品本体通过构建产品类层次及其属性描述为交易双方提供了对产品共享的通用的理解。针对目前电子商务中标准产品本体缺乏产品属性描述的问题,根据电子商务网站中产品信息多以表格形式组织和描述的特点,提出以联合国标准产品与服务分类代码(UNSPSC)为核心本体,结合表格处理技术的半自动产品本体构建方法。以Web表格为对象,对Web表格的识别、表格规范化、单元产品本体及全局产品本体建立进行了研究。这种半自动的本