THUUyMorph:维吾尔语形态切分语料库

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：hbchens

【摘要】

：

THUUyMorph(Tsinghua University Uyghur Morphology Segmentation Corpus)是由清华大学自然语言处理与社会人文计算实验室构建的维吾尔语形态切分语料库.原始语料从2016年的

【作者】

：

哈里旦木·阿布都克里木孙茂松刘洋阿布都克力木·阿布力孜

【机构】

：

清华大学计算机科学与技术系智能技术与系统国家重点实验室,清华信息科学与技术国家实验室,北京100084清华大学人文学院计算语言学实验室,北京,100084;

【出处】

：

中文信息学报

【发表日期】

：

2018年2期

【关键词】

：

THUUyMorph 维吾尔语形态切分

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

THUUyMorph(Tsinghua University Uyghur Morphology Segmentation Corpus)是由清华大学自然语言处理与社会人文计算实验室构建的维吾尔语形态切分语料库.原始语料从2016年的天山网维文版① http:∥uy.ts.cn/下载,题材内容包含新闻、法律、财经、生活等.语料库构建步骤为:爬虫、校对原始语料、分句、校对分句、人工和自动形态切分结合、人工标注语音和谐变化现象、人工校对形态切分和语音和谐变化现象.语料库包含10596个文档、69200个句子,词语类型为89923个,分为词级和句子级两类标注,开源网址为http://thuuymorph.thunlp.org/.该研究不仅对维吾尔语语料库的建设具有参考意义,而且为维吾尔语自然语言处理的研究提供了有益的资源.

其他文献

建筑工程质量管理中存在的问题及相应对策分析

质量是建筑工程的生命,没有质量就没有一切.随着市场经济的发展,以质量为核心的非价格竞争越来越占有重要的地位.工程质量的好坏,将直接严重影响着建设企业的发展.因此,只有

期刊

建筑工程项目质量管理必要性问题措施

辽宁省打破“资源诅咒”发展方式的实证研究

辽宁省是一个自然资源丰富的省份，长期以来经济发展依靠矿业经济带动。然而随着长期的高强度开采，经济增长速度放缓，辽宁省逐渐陷入了“资源诅咒”的怪圈，也就是自然资源丰度与经

学位

自然资源经济增长负相关关系全要素生产率

企业激进并购融资风险分析——以海航集团为例

并购本身就是企业的一种财务活动,并购需要大量的资金支持,必然会涉及到企业融资,融资方式的选择对企业财务状况的影响是巨大的.本文主要以海航集团为例进行分析,首先介绍了

期刊

激进并购融资方式融资风险

我国机构投资者持股与公司经营业绩研究——基于沪深A股的实证分析

近些年，我国机构投资者逐步发展壮大，在我国证券市场上的重要性日益显现。机构投资者作为公司治理的一种外部机制，因为其拥有的信息、专业和经验等优势，可以有效地影响上市公司治

学位

机构投资者持股上市公司治理经营业绩利益保护

2019/20秋冬男鞋单品——复古朋克

PUNK是物质与欲望、理想与环境的不均衡的变形产物,对物质的敏感是PUNK的重要理念.有着冷酷和刚硬气息的音乐似乎把人体身上的压力都用宣泄方式表达出来.鞋款设计中以这种重

期刊

PowerWise华彩尽现简易设计卓识远扬

2010年2月4日,美国国家半导体公司(Nationtol Semieoncluetor Corporation)(美国纽约证券交易所上市代号:NSM)宣布,该公司一直大力推广的Powerwise系列解决方案不仅在业界引

期刊

简易半导体公司纽约证券交易所美国市场业绩设计周期上市绿色节能竞争优势解决方案国家浪潮客户进程计划代号创造产品NSM

FDI对我国不同地区三大产业发展的影响问题研究

中国自改革开放以来制定了一系列措施以吸引外资，并取得了巨大成功。1990年后，我国FDI流入量迅速增加，2003年，我国已超过美国，成为世界第一大FDI东道国，FDI超过500亿美元，截至2004年

学位

对外直接投资区域经济三次产业产业分布

关于铁路通信网光纤传输安全及其保护措施分析

铁路通信技术对铁路系统的正常运行有着至关重要的影响,随着社会经济的不断发展以及铁路运输技术的逐渐提升,铁路运输中的通信系统建设越来越成熟.光纤网络传输在铁路通信网

期刊

铁路通信网光纤传输安全保护措施

带着汉服去旅行

去新疆前，我只认识这里的两个城市，天气预报里的乌鲁木齐和西游记里的吐鲁番。在南方看腻了青山秀水，面对这个地图上无法忽视的地方，我决定带着我的相机和汉服来一次不一样的旅行。　　旅行时间：2017年7月17日～7月27日　　Day 1　　广州-乌鲁木齐　　大巴扎　　此行我们兵分两路，一队搭乘飞机从广州走，一队搭乘火车从深圳走，7月17号中午在大巴扎集合。　　巴扎属于维吾尔族语，意为集市，农贸市场。这里

期刊

喀纳斯湖游览车克拉玛依大巴扎人工瀑布九龙潭

试论中学生学习美术兴趣的影响因素及策略

“兴趣是最好的老师。”兴趣可以更好地引导、促进学生的学习;反之如果学生没有兴趣的话不但学习效果差,而且也不可能学得好。所以,对中学生而言,培养他们的学习兴趣是很重要

期刊

THUUyMorph:维吾尔语形态切分语料库

与本文相关的学术论文