基于互联网1至5元文法语料库的多词表达自动提取

来源 :科技通报 | 被引量 : 0次 | 上传用户：zz5616527

【摘要】

：

多词表达是自然语言中的常见现象，其自动提取对很多自然语言处理任务有着举足轻重的作用。本研究以Google公司发布的基于公共网页的1至5元文法语料库作为词频统计的依据，同时结

【作者】

：

李康熙李为山

【机构】

：

南京大学外国语学院,合肥工业大学外国语学院

【出处】

：

科技通报

【发表日期】

：

2013年10期

【关键词】

：

多词表达自然语言处理数据稀疏 multiword expression natural language processing data sparsenes

【基金项目】

：

中央高校基本科研业务费专项资金资助（2012HGXJ0109）,（2012HGXJ0110）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

多词表达是自然语言中的常见现象，其自动提取对很多自然语言处理任务有着举足轻重的作用。本研究以Google公司发布的基于公共网页的1至5元文法语料库作为词频统计的依据，同时结合自动词性标注的信息，对英国国家语料库的书面语材料部分进行多词表达的自动提取。研究结果表明，该方法能够充分利用Google语料库的精确词频信息，从而提高了多词表达抽取的准确率，并且能够较好地缓解数据稀疏现象带来问题。

其他文献

改进的烟气轮机轴振动监控系统的模糊μ稳控技术

催化裂化车间的烟气轮机属于互相关联的复杂的多输入多输出控制对象,传统的控制算法很难满足其稳定控制的要求.本文首先对催化裂化车间的烟气轮机的机轴震动及机轴位移的控制

期刊

模糊控制二阶欠阻尼系统MATLAB仿真fuzzy controlsecond-order under damped systemMatlabsimula

基于隐性群体双模分解的并行振荡抑制算法

现实的通信网络由多重网络组成，构成具有多维任务分配的复杂网络结构，在任务处理中会产生并行振荡，对复杂网络中的振荡抑制是提高复杂网络并行处理的重要因素。传统的并行振荡方

期刊

复杂网络隐性群体并行特征complex networkshidden groupsparallel mode matching

提高经济效益一定要从实际出发——佛山市工业调查

近3年来，佛山市工业效益明显提高。j981年，工业总产值达105，619万元，比J978年的67，646万元增长5成多；财政收入逐年大幅度增加。国营企业上缴利润1980年比1979年增加38．6％，1981年又比1980年增加14．4％。佛山市由于执行“对外开放，对内搞活经济”的方针政策好，工业确实活起来了。他们的主要经验是：

期刊

工业调查经济效益佛山市从实际出发工业总产值工业效益财政收入国营企业

1985-2004年间钱塘江流域土地利用／覆盖变化

土地利用/覆盖变化不仅直接影响社会经济的发展,而且对资源开发、环境保护和生态功能改善等各方面都有密切关系。钱塘江作为浙江省的第一大水系,其土地利用变化信息对浙江省土地资源的合理规划与使用有着极其重要的意义。本文在对1991年、2004年两期陆地卫星专题制图仪获取的遥感图像进行解译的基础上,结合1985年土地利用统计资料,得出钱塘江流域内1985-1991年间和1991-2004年间土地利用变化情况

期刊

钱塘江流域土地利用/覆盖动态驱动力遥感Qiantang River Watershed land use/land cover dynamics dr

导管架平台隔水导管打桩优化设计研究

为解决陆丰13-2导管架隔水导管打桩作业防斜及打桩过程控制问题,对该油田9口井槽隔水导管打桩作业从打桩设备的选用到打桩作业顺序优化设计进行分析研究,同时将隔水导管打桩

期刊

导管架平台隔水导管打桩作业jacket platform drilling conductor piling

首届中国国际旅游会议综述

由国家旅游局和民航总局联合举办的1983年中国国际旅游会议于2月28日至3月4日在北京召开。来自45个国家和地区的代表957人，加上我国各地旅游局及有关部门代表263人，共1，220人参加了会议。现将主要观点综述如下：

期刊

国际旅游观点综述中国国家旅游局民航总局

国内研究马恩经济思想史及《资本论》创作史获得初步成果

我国研究马恩经济思想史及《资本论》创作史尽管起步较晚，但由于粉碎“四人帮”后学术界共同努力，取得了一些研究成果，出版了一批著译。据不完全了解，国内写的争著有：《从古典经济学派到马克思》（陈岱孙，上海版）、《马克思主义政治经济学的创立》（李善明、周成启，上海版）、《马克思主义政治经济学的创立》（高荣贵，吉林版）

期刊

《资本论》经济思想史国内研究研究成果马克思主义政治经济学创作粉碎“四人帮”古典经济学派

正确认识我国消费品市场的变化——与两个流行观点的商榷

近年来，下述两个有关我国消费品市场的观点，已流行于全国的许多报刊杂志上：一、我国市场已由过去的“卖方市场”，逐步转变为“买方市场”，二、居民家庭开支比重的次序，已由过去的“吃穿用”，逐步转变为“用穿吃力，“用穿当头，“吃”字靠后，这一情况全国已具有普遍性。我们认为，这两个流行观点都是值得商榷的。

期刊

消费品市场流行观点“买方市场”报刊杂志卖方市场家庭开支“吃”普遍性

舰船维修系统建模及能力评估

为解决舰船维修系统能力评估问题，定义了舰船装备保障计划，构造了维修系统实体模型，抽象了维修网络计划图，确立计划优化的目标和能力评价的指标，提出基地、工厂两层仿真模型及仿真

期刊

舰船维修系统评估优化启发式warship maintenance system evaluation optimization heuristic me

苏联农业问题讨论会简介

1983年4月18—21日，中国社会科学院苏联东欧研究所经济室在江苏省无锡市召开了苏联农业问题学术讨论会，中国社会科学院、中国农业科学院、全国6所高等院校以及有关部门的苏联农业问题研究人员约30多人参加了讨论会。

期刊

学术讨论会农业问题苏联中国社会科学院中国农业科学院简介研究人员高等院校

基于互联网1至5元文法语料库的多词表达自动提取

与本文相关的学术论文