基于树库和机器学习的汉语依存句法分析

来源 :2007年全国模式识别学术会议 | 被引量 : 0次 | 上传用户:angyer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于树库和机器学习的语言处理方法是自然语言处理领域中的一个研究热点。本文旨在探索利用语言学手段来提高句法分析精度的可能性。本文采用MaltParser和自建的汉语依存树库进行了相关的汉语依存句法分析实验。通过对句法分析结果的分析,找出了影响句法分析精度的主要因素,并据此对树库中处理某些语言结构的方式进行了修改,然后再对得到的句法分析数据进行进一步的分析,以确定所用方法的有效性。结果表明,无标记依存句法分析精度提高了5.5个百分点,有标记依存句法分析精度提高了7.5个百分点。
其他文献
因液氯罐装全是手工、个体操作,操作人员的责任心、经验、能力等人为因素,对安全生产影响很大。故对生产中常见问题作以归纳,就具体问题的解决方法作了明确的规定,并时常模拟演练,使问题得到有效的解决,避免了事故的发生。
介绍了氯气性质、氯气液化包装的原因、液氯包装的各种工艺及其特点,详细介绍了屏蔽泵的结构特点,大连海密梯克公司所产屏蔽泵和与其他公司产品在选材、性价比、维护等方面比较,突出该泵在液氯包装上面的优越性。
研究先进的设备管理系统应用于发供电集团,以达到节省投资、降低维护费用、降低库存成本、控制资金计划,提高办事效率、提高企业管理水平、保障安全生产等目的,值得同行借鉴。
综放工作面通过层间距小于10m的不稳定巷道时,使用新型注浆锚索实现全长锚注,提高围岩自撑能力、降低支护成本、缓解巷道顶帮及底板压力,使巷道围岩改为主动支护,有效地保证采煤工作面的顺利跨采。
分析305工作面煤层赋存特点和地质构造,确定合理层位,将工作面顶、底板平缓调整到位,并加强对顶板的管理是通过向斜构造的关键。
通过对高频斩波串级调速在大功率风机上应用的原理,埠村煤矿二井主通风机采用了转子串水电阻降压启动系统。技术改造运行表明提高了通风机效率,节约了能源。
连续采煤机的切屑图反映截齿截割顺序和截槽形状及其相互关系,是衡量连续采煤机截割性能和工作质量的重要手段,文章通过对连续采煤机切屑图形成过程的分析,建立了切屑断面形状的数学模型,设计了切屑图可视化设计软件,模拟得到了不同工况下的切屑图,为判断截齿排列和参数确定合理与否提供了依据,为连续采煤机截割机构的计算机辅助设计创造了条件。
提出一种基于模糊约束满足的运动车辆分类方法。通过从交通监控视频中提取局部断面,构造车辆运动轨迹图像。从运动轨迹图像中提取车辆特征,并使用运动统计行记录车辆的运动变化信息。设计模糊约束满足问题算法,对提取的车辆特征信息进行分类。
在基于内容的音频信息检索技术研究中,人们更期望直接使用语音检索出相关的音频信息。因此,如何利用语音信息进行音频信息检索是一个研究热点。本文针对基于说话人的语音检索,引入反转隐马尔科夫模型,提出了一种基于反转隐马尔科夫模型的说话人识别方法,并通过实验说明了该方法的有效性。
有限状态自动机理论能够有效描述语言现象,近些年,自动机方法在自然语言处理领域得到了广泛的应用。本文给出了一种基于有限自动状态机的英语词法分析方法,该方法在词法分析方面具有较高的效率,能同时完成、生成和分析,弥补了普通的词法分析技术的单向性缺点。本文首先对自动机及其相关算法、形式中的正则文法、正则表达式进行了论述,分析自动机、正则文法和正则表达式之间的等价性,然后结合自动机理论对双层词法模型的原理进