【摘 要】
:
汉语的一词多义现象使机器对自然语言的处理带来了许多困难,很多自然语言处理领域的问题归根结底都是解决词语的歧义问题。如何才能让计算机理解一个歧义词在其特定的上下文中
论文部分内容阅读
汉语的一词多义现象使机器对自然语言的处理带来了许多困难,很多自然语言处理领域的问题归根结底都是解决词语的歧义问题。如何才能让计算机理解一个歧义词在其特定的上下文中准确的含义是词义消歧需要解决的首要问题。词义消歧对于很多自然语言处理的应用问题都有非常重要的作用,诸如信息检索、机器翻译、文本分类和自动文摘等。本文研究的是统计学习方法中的有指导的词义消歧方法,这种方法与机器学习方法的结合是当前主流的词义消歧方法。而且这种方法的灵活性好,扩展性高,同时还能够应付语言的发展变化,受到了国内外学者的一致好评。本文主要有以下几部分的研究内容:首先,研究了词义消歧的多种分类方法,介绍了比较权威的词义消歧评测体系,并提出了在词义消歧的过程中可能遇到的问题及解决方案。其次,研究了词义消歧特征工程的两方面内容:特征的提取和特征的选择。在特征提取部分,研究了基于滑动词窗和基于句法分析树的特征提取方法,重点阐述了句法分析树的建立过程以及基于句法分析树的特征提取方法的算法流程。在特征选择部分,研究了基于词的特征提取方法,利用句法信息的特点,提出了将句法信息和词性信息融合的特征选择方法。同时,根据朴素贝叶斯模型的鲁棒性和适用性等特点,优化了基于句法树的贝叶斯词义消歧分类模型。最后,研究了词义消歧模块在机器翻译中的应用。在实际机器翻译系统中加入了词义消歧模块,虽然研究并不完善,得到的结果也不是很令人满意,但也能给机器翻译提供一定的现实意义。
其他文献
随着网络技术的飞速发展,网络安全问题也越来越突出,传统的入侵检测技术已经很难应付各种复杂的网络攻击。免疫系统具有的自适应、自组织和分布性正是传统的入侵检测技术所期望
在现代钢管焊缝缺陷检测中,常采用人工评阅X射线底片的方法,人工评阅主观性较大,评阅人员在大量重复性的脑力活动下,极易产生疲劳,很大程度上影响了检测的效率和准确性。基于
随着现代物流业的快速发展,物流灵魂的仓储管理技术(WMS)的研究与开发已成为需求紧迫,前景广阔的课题。尤其是仓储设备由机械化进入自动化阶段,仓库管控呈现出新的发展趋势,技术
随着计算机图形学与以三维扫描为代表的硬件技术的发展,三维几何数据在当今社会得到了广泛的应用。在以三角形表面网格成为三维几何数据主流表示形式的同时,四面体网格(下称
混合结构视频网格利用客户端主机资源为其他用户提供视频服务,缩短了视频数据流的传输路径,扩展了系统结构,增强了系统的服务能力。但是,由于客户端主机性能差异较大且经常随
随着信息技术的飞速发展,软件的应用领域不断扩大,但是软件的可靠性和质量却没有得到相应的提高,这成为制约软件产业发展的一个重要因素。工业控制、交通、金融和医疗等领域
在三网融合逐步实现的大背景下,本文分析了三网融合、智能电视、AppStore、云计算的发展现状与趋势,针对当前电视发展存在的内容服务缺乏的问题,提出采用云计算技术、AppOnline
在网络技术不断发展和成熟的时代,越来越多的组织和机构加入互联网,在网络上发布和分享信息。因此,人们获取和管理信息的方式正在从书本向网络上转变,但网络上的信息量日益剧
随着计算机技术的发展和广泛的应用,人们对互联网越来越依赖,萌发了大批的中小型互联网创业企业,大量的传统行业逐渐转移到了互联网。因而网络所带来的威胁已远非从前能比,层
随着3G以及WIFI网络的发展以及网络带宽的提高,视频监控这种直观方便内容丰富的方式成为住宅,交通等领域的重要防范手段。传统的视频监控系统主要用于安全监控产业,摄像前端