基于最大熵模型的汉语动词与动词搭配识别

来源 :中国中文信息学会二十五周年学术会议 | 被引量 : 0次 | 上传用户:yingzizhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析一直是自然语言处理领域的一个重点和难点问题,准确的动词与动词搭配关系识别可为建立完全的句法分析奠定一定的基础.本文提出了一种基于最大熵模型的汉语动词与动词搭配识别方法,选取目标动词与搭配词的上下文词性信息及其关联程度的统计信息构造候选复合特征模板以及类别信息,利用粗糙集理论中的约简技术,删除复合特征模板中冗余的原子模板,从而获得训练最大熵模型所需的极小模板.四组实验结果表明(1)以同时包含上下文词性信息和统计信息的模板与类别信息模板结合构造的识别模型优于仅含上下文词性信息或统计信息的模板与类别信息模板结合所构造的识别模型;(2)较之搭配定量体系方法,最大熵模型的搭配识别效果较好;(3)结合了粗糙集理论的最大熵方法保证了所构造的模型的简洁性,提高了模型的泛化能力.总之,最大熵模型用于动词与动词搭配识别是可行的.
其他文献
本文叙述了现代维吾尔语词类体系和构词自动机,确定了现代维吾尔语词性标注标记集,论述了带词类标记的词典为基础的封闭词库中设计的表,上下文规则库来确定词性的方法来解决维吾
SgmLP是俄罗斯学者图佐夫教授主持研发的一种面向俄语文本的自然语言处理技术,其核心是文本的语义处理,因而命名为SemLP(Semantic Language Processing).它由语义词典、语义
本文首先提出汉语词汇语义知识表示的一种解决方法:对动词、形容词从格框架角度用论旨网格描述其句法、语义、语用知识,对名词从槽关系角度用槽关系联想表达式(槽类型、槽序)
会议
目的 观察右美托咪定复合罗哌卡因硬膜外注射对先兆子痫产妇分娩镇痛的影响.方法 将80例先兆子痫且自愿接受分娩镇痛的产妇随机均分为对照组和右美托咪定组.硬膜外穿刺成功后
肺真菌感染常发生于器官移植受者、恶性肿瘤患者、恶性血液病患者等免疫功能低下者,其主要由隐球菌、念珠菌、曲霉菌等真菌侵入肺部导致.但随着城市化发展与人群流动的日益频
主谓谓语句是汉语的一种特殊句式.学术界对主谓谓语句的存废、范围、性质、分类、语义分析等问题一直存在争议.本文在标注语科库的基础上,建立了"中小学语文课本主谓谓语句例
会议
etelcalcetide为一新型钙离子敏感受体激动剂,能够降低甲状旁腺激素水平.由安进制药公司开发,于2016年11月获欧盟批准用于慢性肾病透析患者继发性甲状旁腺功能亢进症的治疗.
投连险销售正当时,关键是如何正确的销售  光有好时机还不够,还要考虑产品设计、销售人员选择与培训及目标客户群的筛选  在资本市场大熊当道的时候,任何推出投连险的保险公司都没有逃脱资本市场下滑的厄运,中国人寿就在推出投连险半年之后以停售收场。投连险全称是“投资连结保险”,这是一种与资本市场紧密相连的保险产品,即在保险里设立有独立的投资账号,由投保人操控,受资本市场的变动影响较大。  目前,就停售投连
消费信贷既可以调节消费品供求总量,又可以调节供求结构,促进产业结构的升级和优化,扩大劳动力就业。长期以来,拉动经济增长的“三驾马车”中,出口和投资占有比重过高,消费比
目的 系统评价抗白细胞介素13(IL-13)单抗治疗中至重度未控制哮喘的疗效与安全性.方法 计算机检索PubMed、Embase、Cochrane Library、Web of Science、中国知网、万方和维普