基于条件随机场的汉语动宾搭配自动识别

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:bigfish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出一种基于机器自动学习的统计模型条件随机场的方法用于汉语动宾搭配的自动识别。实验比较了两种分词与词性标记集下的识别效果,并增加了词性筛选准则作为优化处理。在特征选择上,考察了动词次范畴特征、上下文特征以及它们之间的组合特征的不同实验结果。综合实验结果,基于树库分词和词性标记的最好结果F值是87.40%,基于北京大学标准的分词和词性标记的最好结果F值是74.70%。实验表明,条件随机场模型在词语搭配实例自动识别方面有效可行。
其他文献
长期以来,寰椎骨折的治疗存在多种争议。该文在对单纯寰椎骨折机制、分型和稳定性进行文献复习的基础上,重点介绍寰椎骨折的治疗进展:对于稳定型寰椎骨折,通常采用保守治疗;对
揭示了港口布局层次性的规律,分析了港口布局层次性的形成机理和经济性,指出了港口布局层次性是由货主、港口、船舶和地区开发等经济利益协调发展的内在经济规律所决定的。
文章论述了利润表设计的理论依据,通过我国利润表同国外利润表比较,发现我国利润表的编制基础对会计信息的陈报存在不利影响,并结合实际情况,提出了未来利润表改进办法。
随着我国机电产品在出口商品中所占比重的不断增加,机电产品的质量认证和出口反倾销问题已成为制约机电产品出口的重要因素。切合实际,解决好这两个问题,对于提高出口机电产
作业弹性预算法模型是集成本预算与作业成本法之所长 ,将两者结合从而构筑起成本管理决策的一种新体系。从航空制造企业作业弹性预算法模型的可行性分析入手 ,着重论述该应用
<正>油墨印刷时需要不透印,即一面的油墨不渗透到另一面,否则会影响到另一面的字迹或画报的清晰[1]。近期,客户反应我们的纸页存在透印现象、不透明度低的问题。滑石粉是我国
民间资本天然不是创业投资,但发展创业投资关键就是发展民间创业投资资本。加快实现民间资本和中小企业创业投资的对接,不仅能为民间资本拓宽投资渠道,还能有效促进创业投资
城市群是区域经济的重要增长极。要在中部崛起中加快江西的发展,就必须构建以南昌为中心,九江、景德镇、鹰潭为次中心,涵盖22个县(市)的环鄱阳湖城市群,整合区域内经济、文化
2006年1月20日,国家发改委颁布《可再生能源发电价格和费用分摊管理试行办法》,明确了2006年及以后建设的可再生能源发电项目上网电价及费用分摊管理办法。可再生能源中的风能
随着现代社会经济的快速发展,在广播电视领域无线覆盖已经成为一个必然的发展趋势,得到了广播电视行业的一致认可。但是当前我国的无线广播电视发射台一直延续着旧的有人值守