基于汉蒙依存句法树转换的蒙古文依存句法分析

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:yahoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析是自然语言处理的关键技术之一,其主要任务是消除句子中由词法和词组结构引入的歧义问题。句法分析对自然语言处理起着至关重要的作用。一方面,句法分析能够有效地验证树库构建体系的正确性和完备性;另一方面,句法分析能够直接服务于某种上层的应用,比如关键词的识别和搜索引擎用户日志分析等。近年来,依存结构句法分析凭借其结构简单、易于标注、便于应用等特点逐渐成为自然语言处理领域的研究热点。然而,针对蒙古文的依存句法分析的研究却相对较少。本文在结合了短语结构句法树优点和依存结构句法树优点的基础上,提出一种基于汉蒙依存句法树转换的蒙古文依存句法分析方法。首先,使用基于词汇化概率的上下文无关文法的斯坦福句法分析器对输入的汉文句子进行基于短语结构的句法分析,生成汉文短语结构树,并结合蒙古文语序和汉文语序的特点构建蒙古文调序模型,依据调序规则重新调整汉文语序,使得汉文语序与蒙古文语序保持一致;接着,制定短语结构树向依存结构树转换的转换规则,利用中心节点转换法实现短语结构树向依存结构树的转换,并对其进行剪枝后处理,从而生成汉文依存结构树;最后,利用联合概率模型实现汉蒙双语的词对齐,并对蒙古文中一些特殊的语法现象进行后处理,最终得到蒙古文依存句法树。实验结果表明,结合短语结构树和依存结构树的特点进行蒙古文依存句法分析能够有效地利用短语结构内部特征和短语外部关系进行蒙古文依存句法分析。该方法得到的蒙古文依存句法分析的准确率可达77.31%。
其他文献
传统农业大多劳动强度大,对劳动经验有较强的依赖性,智能农业机械导航系统将是解决此问题的有效方法之一。基于双目视觉的导航系统因价格低廉,信息丰富等优点受到越来越多的
在工业生产环境中,将无线技术应用于工业测控系统,带来传统测控系统无法比拟的优势。由于工业无线网络中信道环境复杂和无线节点资源受限等因素,现有无线网络的路由机制已经
现代安全系统中,加密算法通常需要在不同的复杂环境中执行,而应用环境中用户的密钥一旦泄露往往直接导致传统安全方案的完全失效,事实上此类密钥泄露在真实环境下是难以杜绝
RFID与企业业务流程进行集成已成为RFID领域的一个重要的研究方向。而现有的RFID业务流程集成方案大都基于传统的业务流程引擎,并不能很好地满足RFID业务流程的需求。并且现
Ad Hoc网络是一种不依赖于固定基础设施的移动网络,在这个网络模式中,移动节点既是主机也是路由器,它是完全自组织、自适应的由无线节点组成的新型网络。无论是在军事、抢险,还是
在E-learning教学环境中,多媒体课件是使用最为广泛的教学内容载体。而针对多媒体课件的检索服务可以使学生方便地选择他们所感兴趣的部分从而提高了教学效率。基于语音的内
随着云计算技术的发展,云存储服务逐渐成为商业应用及个人应用普遍采用的存储解决方案。用户向云存储服务端发出文件下载请求,云端服务器收到请求后开始提供内容分发服务,内
随着RFID应用规模的不断扩大,读写器网络以及网络中的RFID数据流变得越来越复杂,这对RFID中间件提出了新的要求。在RFID网络化应用中,中间件需要全面地获知读写器网络以及网
随着Web技术及其应用的快速发展,XML已经成为万维网上信息表示和数据交换的一个重要标准,XML在电子商务、电子数据交换、科学数据表示、数据建模与分析和搜索引擎等领域有着
视频序列中运动目标跟踪技术是计算机视觉领域最活跃的课题之一,它涉及到图像处理、模式识别、自动控制等诸多领域,具有较强的研究价值。基于粒子滤波理论的目标跟踪算法是一