基于框架的词语搭配自动抽取方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:lijincai0122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于框架的词语搭配抽取方法,可以同时获取词语搭配以及搭配结构信息.引入相对词序比(RRWR)的方法对候选搭配词语进行筛选,应用语言学中词语搭配组合规律对候选搭配的词性进行限定,利用互信息等统计学模型在大规模语料中进行词语搭配的自动抽取,抽取的搭配平均准确率为84.73%,较Xtract系统高4.7%,较国内同类工作结果高50.79%.并且在获得搭配的同时得到了词语搭配的结构信息.
其他文献
1.概述在车床上攻内螺纹多见于轴类工件的端面中心部位。最早的攻螺纹方法是:用车床顶尖顶住丝锥尾部的中心孔,用扳手卡住丝锥尾部的四方部位,利用车床的旋转运动进行攻螺纹。这
发现约束频繁(约束最大频繁)项目集是多种数据挖掘应用中的关键问题,目前已有许多算法可用于发现约束频繁(约束最大频繁)项目集,而对约束频繁(约束最大频繁)项目集维护问题的
This work is carried out to determine the empirical boundary conditions of concentration/separation of yeast cells, red blood cells of rats and guinea pigs in s
青松是陶渊明诗歌中具有代表性的意象之一,陶渊明笔下的松,或表现自己坚定不移的志向,或象征自己的理想人格,或代表田园生活的欢欣自在,成为诗人精神慰藉的所在,是他孤高傲岸
随着互联网的蓬勃发展,违规信息也开始在网络中日益增加。鉴于机器学习领域的分类算法在垃圾邮件分类、真假评论识别等方面的成功应用,本文研究使用机器学习的方法,对聊天信息这种形式较多较杂,内容较多变的文本数据进行分析,从而对背后的聊天账号进行分类与识别,将结果分为正常账号和涉嫌违规账号两个类别。本文以某游戏公司的聊天软件在某段时间内的聊天记录作为数据,在进行分词、提取关键词、特征选择等数据预处理工作后,
<正>本刊讯根据国家标准委2017年第四批国家标准制修订计划,住房和城乡建设部组织苏州混凝土水泥制品研究院有限公司等单位起草了国家标准《预制装配化混凝土建筑部品通用技
目的探讨EP300基因rs20551多态性与缺血性脑卒中痰瘀证和冠心病痰瘀证的易感性及其临床凝血功能的关联.方法选择缺血性脑卒中痰瘀证患者550例(脑卒中组),冠心病痰瘀证患者550
微孢子虫病是一种新近被临床逐渐认识的移植相关性疾病,其感染病原体微孢子虫属于真菌,引起的症状因感染部位而异,如消瘦、腹泻、头痛、嗜睡、乏力、神志不清甚至全身弥漫性致命
高校分层次教学是一种新的教学思想方法,也是教学方法在素质教育方面的新的探索.分层次教学是提高高校课堂教学效率的有效途径之一,是对传统的统一要求的教学模式的一种改进.
1.UPS 业务概况:UPS是全球最大的速递机构,全球最大的包裹递送公司,同时也是世界上一家主要的专业运输和物流服务提供商。每个工作日,该公司为180万家客户送邮包,收件人数目