语料标注相关论文
针对军事指挥控制保障领域各种技术数据资料挖掘处理和融合应用效率低下的问题,提出利用知识抽取技术获取关键知识及其相互关系,形......
"全球汉语中介语语料库"(1)是因应汉语作为第二语言教学的学科建设和科学研究的需要而设计建设的一个迄今为止规模最大的汉语中介......
篇章分析系统性研究的开展依赖于大规模高质量的标注语料.现有标注语料以纯手工标注和单机辅助标注为主,难以满足标注效率和语料质......
语料库语言学是当代计算学语言学中经验主义方法论取得显著成效从而在计算语言学领域占有一定的优势地位的新学科方向。语料库不仅......
随着中国互联网用户的爆炸式增长,中文信息处理技术在互联网领域受到越来越多的重视。中文组块分析,因其在具有词法分析效率的同时又......
意见挖掘是指针对主观性文本自动获取有用的意见信息和知识。汉语意见挖掘技术的研究需要汉语意见型主观性文本标注语料库的支持。......
近年来,随着博客、电子商务、社交网站与微博等信息平台的兴起,主观性文本的信息量迅速膨胀。为了自动分析这些主观性文本包含的观......
对于社交媒体平台而言,识别和标注出特定语言的文本对于情感分类、趋势提取、预测电影评分等研究都具有重要的现实意义。传统的语......
面向任务的对话系统是智能问答系统最热门和最有应用价值的子领域之一,而面向任务的对话系统需要大量的标注数据进行训练,数据标注......
随着大数据和人工智能技术的深入发展,语料库研究得到越来越多的关注和重视。从最开始的面向语言学研究的言语材料集合到如今支撑......
中国文化博大精深,汉字的发展在中国更是有着几千年的辉煌历史.在历史的发展进程中,以汉字形成的中文篇章往往以句间语义关系的复......
文本作为最常用的一种自然语言的载体,是一种重要的原始空间数据来源,蕴含了大量的GIS(地理信息系统)空间查询信息。从文本中获取......
自然语言是人类空间认知结果的主要表现形式,文本即是人类最常用的一种自然语言,也是一种重要的原始空间数据来源。从文本中获取未......
摘要:作为一项重要的基础资源,双语平行语料库在人工智能领域的研究起着举足轻重的作用。我国涉及少数民族语言的双语语料库的探索工......
基于语料库的电脑辅助翻译教学目前大多采用词性标注、句法标注、语义标注以及词频计算、词汇检索、词语搭配等基于词汇语法范式的......
术语抽取是学术文献知识挖掘的关键技术,其研究目标是提升学术文献领域术语抽取的效率。目前术语抽取主要分为三类方法,即基于规则......
本文简要介绍了国内满文(锡伯文)信息处理现代化技术方面的有关情况.例如:满文操作系统,锡伯文、满文字处理软件系统,满汉文机器翻......
语料标注是语料库构建的一项重要的基础性工作。基于搜狗日志,该文借助XML文档的结构化特点,将语料标注转换成节点属性的改写,根据......
笑话作为国家级非物质文化遗产,历史悠久,普遍存在于人们的日常生活中,是最贴近人们生活的艺术体裁之一,笑话的理解也是人工智能发......
建立个性化语料库有助于学生顺利地确定毕业论文选题、进行研究和完成撰写任务。学生建立毕业论文写作个性化语料库应当在教师指导......
摘 要:篇章关系(Discourse Relation)是篇章语义分析的重要内容,本文在英文篇章关系研究的基础上分析了中英文间的差异,总结了中文篇章......
目的:开展基于主动学习的中文电子病历命名实体识别研究,旨在优化机器学习模型,并降低标注成本。方法:分析比较信息熵、语料长度以......
针对高表现力情感语音合成的需要,设计并建立了一个具有四种情感状态(正常、喜悦、忧伤、愤怒)的高表现力情感语料库.该数据库包含10......
汉蒙对照双语语料库是建设综合型语言知识库的有机组成部分,又是基于实例的机器翻译系统的基础。因为双语语料库中包含两种语言互译......
语料库作为一种即时高效的辅助手段,已经被广泛地应用于外语及翻译研究中,并且取得了丰硕的研究成果,但是如何利用语料库来辅助翻......
篇章句间关系(Discourse Relation)是篇章级语义分析的重要内容,该文在英文篇章句间关系研究的基础上分析了中英文间的差异,总结了......
篇章结构分析是自然语言处理领域的一个重要研究方向.篇章结构分析有助于理解篇章的结构和语义,并为自然语言处理的应用(如自动文......
随着信息技术的发展,互联网上由用户产生并带有情感倾向的信息显著增加。对产品评论进行语料标注并进行文本倾向性分析,能够帮助用......
文章探索了中古汉语研究型语料库的设计原则和具体构建方法.首先,明确了中古汉语语料库设计的总原则,并针对语料库构建过程中的每......
英语专业的翻译教学所面临的主要问题是与现实脱节.基于语料库的翻译教学在实训过程中以大量实际运用的实例语篇为例, 并通过语料......
语料库是语言处理的重要知识源,语料库标注则是挖掘语料库潜在价值的重要方法和途径。本文在已有语料库标注实践的基础上,总结分析......
为解决传统的情感分析方法中存在的语义理解能力不足和情感分析不充分问题,本文从语义的角度,运用构建模糊情感本体的方法,对中文......
文章指出文科研究者应当顺应语料库翻译学的趋势,在科研工作中根据个人的研究需要自建小型的汉英平行语料库,让翻译研究带上定量研......
期刊
本文提出了一个汉语盲文语料库的建设方案。由于现行盲文在分词连写和标调方面的特点,汉语盲文研究难以直接使用明眼文语料库,需要......
以语料库为基础的计算机辅助翻译(CAT)模式是提高涉外警务翻译能力的一个有效手段,而CAT的前提是警务翻译语料库建设。警务翻译平......
目前汉语中介语语料库标注代码设计没有统一标准,不同语料库的分词及词性标注代码和偏误标注代码不一致等问题,造成了语料共享困难......
近年来,利用语料库处理各种语言现象已被许多语言学家及计算机专家所认可,各种类型的语料库应运而生,但关于东北地方口语语料库的......
在人工智能时代,自然语言处理技术在各领域的应用越来越广泛。虽然机器学习、深度学习等各种各样的算法模型层出不群,但是在特定领......
该文简要回顾了中文信息处理30年的主要成果,以及近20年来中文信息处理中的计算语言学研究的状况。该文分析了汉语与英语的主要......
针对大规模语料手动标注困难的问题,提出利用概率潜在语义分析(PLSA)模型的新闻评论自动标注方法.利用PLSA计算获得语料集的'......
《红楼梦》中英文平行语料库的建立,能够方便翻译学者充分利用语料库的诸多优势,系统、全面地进行研究。然而,在其创建过程中还存......
翻译质量评价是联系翻译理论与翻译实践的桥梁,而定量研究则是翻译质量评价研究中的热点。目前,英汉翻译在我国外语测试中应用广泛......
在网络信息时代,日新月异发展的语料库已应用于相当广泛的领域,引起了众多学科的革命。如今,语料库也已经应用于教学方面,但多是应......
语料库标注是语料库构建的一个重要环节,除词性标注外的各类标注一般都较难实现批量操作或自动化.本文介绍了文本处理软件PowerGre......
本文探讨如何将手工标注的"精加工"平行语料库与教学细节有效结合,以辅助翻译教学。在课程教学目标的指引下,语料库可以作为教学内......