基于规则抽取的汉语语块识别

来源 :河北大学 | 被引量 : 0次 | 上传用户:wangtan2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语块可用于自然语言处理领域中,其中包括信息抽取、问答系统、语句相似度的比较等应用系统研究中,也可以应用于句法分析。并在这些领域中发挥了重要的作用。本文主要从句法分析的角度以基于规则的方法为出发点来对汉语功能语块进行识别,这种方法根据词性在句法分析中所起的作用来区分不同的功能语块,以标注显示句子的结构骨架。这种方法相比较于其它方法所选择的特征少,识别的速度快,同时提高了对多动词连用结构的识别率。此后又用决策树的方法对汉语功能语块进行识别,这种方法不需要人工抽取规则,在一定程度上提高了识别率。对于汉语基本语块,根据词汇之间的关联信息,语义关系以及句法形式来确定汉语基本语块。对汉语基本语块的识别,采用了规则抽取和统计相结合的方法,有效地提高了识别率。这种方法使汉语基本语块有很强的内聚性,把句法形式与语义内容关联起来,同时也考虑到了语义消歧,在一定程度上避免了歧义的发生,补充了单纯依靠置信度进行消歧的缺陷。
其他文献
组态软件在工业控制领域快速发展,是因为组态软件包含了一些已经开发完成的,具有通用性的控件。使得工程人员在开发具体项目时可以方便的进行各种组态。而嵌入式组态软件的出现
本文根据目前字符验证码的发展现状,对验证码识别技术进行了研究和探索。详细介绍了验证码识别过程中各个步骤所使用算法,总结了它们的优势与不足,对验证码识别的技术难点进行了
随着计算机和网络技术的普遍使用,使人们可以很容易获得海量数据。然而,在一些实际应用中,获得大量已标注的样例是非常困难、昂贵或耗费时间的,而取得未标注的样例则相对容易
受审美水平提高、追求个性化的影响,在家具选择上,人们已不再拘泥于传统的直线矩形家具,更青睐于组合新颖个性、造型别具一格的曲线家具。这就对封边机的封边功能提出了曲线
随着人们生活质量的提高和远程自动抄表技术的发展,传统的抄表方式很难满足现代人们日常生活的需求,传统抄表方式的种种弊端显现越来越明显,如成本高、劳动强度大、精度低和线路
随着互联网技术的发展,网络攻击的手段不断变化,网络攻击的门槛也越来越低,给社会造成了巨大的损失,因此网络安全越来越受到重视。传统的安全防护技术面对复杂的网络环境难以
WS (Web Service)提供了一个中立的、语言无关的平台,支持网络上机器之间的交互操作。然而,不同部分之间的应用调用产生了安全威胁。消息交换安全是WS中需要考虑的一个很重要
如何控制网络拥塞、优化网络性能,提高网络服务质量是急待解决的问题。本文研究流量监控及网络性能优化中几个主要问题,包括:网络流量监测点优化部署、基于多速率VBR业务流量
近年来计算机应用技术的飞速发展促进了互联网的普及和应用,使得计算机迅速走进了千家万户、各行各业。人们享受到计算机所带来的好处的同时,也为随之而来的问题感到困扰。安
云环境资源与服务类型的不确定性、动态变化性且存在虚假或欺诈的服务行为使得用户很难获取到理想的服务。因此云环境中引入服务信任评价机制十分重要。本文研究基于服务信任