语料库构建相关论文
中国科技典籍作为中华典籍与世界典籍的重要组成部分,不仅是中国科技文明与发展的载体,也为中国同世界的科技文化交流做出了重要贡献......
口令是当今互联网主要的身份认证方式,对用户的隐私起十分重要的保护作用。本文从用户口令词汇的规律性入手,重点研究口令词汇的特......
随着国家少数民族工作治理理念的调整变化,少数民族地区推广普及国家通用语言的工作,显得尤为重要,让藏族学生潜移默化地、自觉自......
从大量军事文本中快速、准确地获取需要的有效数据信息,并转化为人和机器能够共同理解与使用的结构化形式,是当前军事信息处理领域......
中医理论知识体系结构庞大,实体和实体间关系错综复杂,需采用合适的技术手段对该领域知识加以组织和存储,以便能灵活地运用到日常......
学位
当前心血管疾病已经成为导致居民死亡的最主要原因,包括Framinham心脏研究在内的多项研究表明,心血管疾病与风险因素密切相关。我......
近年来,随着信息技术的不断发展,自然语言处理的研究逐渐转向自然语言理解的研究,机器阅读理解便在这个大背景下应运而生。机器阅......
随着互联网的迅速发展以及移动智能终端的普及,越来越多的用户在以微博为代表的社交网络上表达自己的观点和情感,由此产生了大量富......
互联网技术飞速发展的今天,网络空间所包含的大量文本数据中既蕴含着智慧的结晶,又存在着潜在的风险。在此背景下,基于自然语言处......
近年来,随着生物医学实验方法的变革,相关实验数据和文献资料呈现指数级的增长,如何从规模庞大的科学文献数据中快速有效地抽取出......
近年来,流式文档广泛地应用在社交、媒体、办公以及出版等领域。面对海量的流式文档,如何使计算机自动、准确地理解文档成为了各行......
让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向。语音合成在导航、通信等领域都有广泛运用。目前,文语转换依旧是语......
缅甸语是缅甸的官方语言,属汉藏语系藏缅甸语族缅甸语支,与同语系的汉语和藏语语音合成研究相比,缅甸语语音合成相关研究亟待重视......
在自然语言中,事件是一个基本的语义单位,是构成文档的基本要素。事件可信度描述了该事件是确定、否定或者是不确定等情况,表达了......
近年来,随着国家及民众环保意识的增强和强有力环保举措的实施,我国的大气质量状况也日益改善,但公众对于美好生活环境的要求也越......
随着大数据和人工智能技术的深入发展,语料库研究得到越来越多的关注和重视。从最开始的面向语言学研究的言语材料集合到如今支撑......
本文介绍了情感语料库构建方面的一些经验,讨论了在设计和建设情感语料库中的几个基本问题:制定标注规范、选择标注集、设计标注工具......
语料库是英语教学的基础,完整的、系统的语料库能够提升学生英语词汇学习效率,丰富学生英语词汇量,本文主要探究语料库在高校英语......
双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。......
语义元数据提供数据的语义信息,在数据的理解、管理、发现和交换中起着极为重要的作用。随着互联网上数据爆炸式的增长,对自动元数据......
针对中文零指代问题,从篇章视角进行理论分析,并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus,CDZC)的构建工作。首先......
运用语料库语言学的基本观点,探讨了陕北民歌语料库构建原则及WEB管理系统的设计实现,研制了陕北民歌ACCESS语料数据库,其中包含全......
京津冀地区是我国北方经济发展的一块腹地。加大对该地区的经济开发,推进多样化的经济形式向外延展是河北省现阶段的重大战略。当......
提高红色旅游英译水平,扩大海外旅游市场至关重要。为此,研究对红色旅游及其英译现状作了概述和评论,包括国外和国内的研究,前者涉......
双语语料库在机器翻译研究中的作用已日趋明显,但作为一项重要的语言资源,双语平行语料库的系统性构建在中国国内尚未得到充分的关......
韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中不一致、耗时的缺点.仿照人工标注流......
篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型......
利用BRAT标注工具及人工标注方法,根据初步制定的文本语料标注规范,按照语料选择、语料预处理、语料标注、标注校对、一致性检验的......
该文针对目前翻译教学模式单一,学生翻译学习主动性不强等问题,提出语料库辅助翻译教学的构想,介绍自主建立语料库方法,建库常见问......
建设高质量的标注语料库是现代哈萨克语自然语言信息处理领域的基础性工程,本文根据哈萨克语独特的语言特点,进行词级带标注的哈萨......
本文就构建教学型国学翻译汉英语料库过程中遇到的语料库大小、语料采集和语料库构建细节问题进行了讨论,旨在推动构建教学型国学......
为了促进英语科技文献的汉译研究和科技英语翻译教学研究,我们构建了较大规模的"科技文献英汉翻译平行语料库"。通过选择9本科技英......
在经济全球化趋势的影响之下,近年来我国高校商务英语教学工作不断向前推进,为复合型人才的培养做出了突出的贡献,为推动我国经济......
地理实体关系语料库是地理信息获取与地理知识服务的基础数据资源,其规模直接影响机器学习模型训练的效果。快速更新的网络文本不......
提出维吾尔语情感语料库的构建规范,设计和实现维吾尔语情感语料库辅助整理系统。该系统结合维吾尔语情感语料的具体特点,多方面分......
文本情绪分析研究近年来发展迅速,但相关的中文情绪语料库,特别是面向微博文本的语料库构建尚不完善。为了对微博文本情绪表达特点......
?针对“未然态”的舆情信息,挖掘网络热点、焦点及敏感话题,把握舆情动态,提高处置与监管网络突发事件能力等,是舆情分析的重要研......
随着人工智能技术的不断发展,人机对话系统的构建成了研究领域里的一大热点,人机对话的实现离不开计算机对于文本信息(以下简称“......
中文分词任务是机器翻译、自动问答、信息检索等自然语言处理任务的基础工作,其研究具有重要的理论意义和应用价值。面向社交媒体......
随着全球化的不断推进,中国与东盟各国的交流越来越频繁。越南作为与中国接壤的国家,与中国在政治、经济、文化等方面的交流更是与......
在自然语言处理及其应用领域,人名和称谓作为重要的命名实体,是信息处理的关键部分之一。该文从命名实体识别和资讯提取的角度出发......
面向双语术语抽取这一应用目标,提出专业领域可比语料库的构建方案并进行实验论证。针对给定的主题领域分别进行中英文专业语料的......
地理实体关系语料库是地理信息获取与地理知识服务的基础数据资源,其规模直接影响机器学习模型训练的效果。快速更新的网络文本不......
自然语言中存在大量否定与不确定信息,针对此类信息的识别是目前信息抽取领域研究热点之一。英文中否定与不确定信息识别研究较早,但......
在外语教学和语言研究界,自建小型语料库已经成为一个热门话题并孕育着十分广阔的应用前景.语料库分析工具AntConc因其本身的特点......
语料库是一切自然语言处理的基础,尤其是在机器翻译、语音识别等应用的大趋势下,构建高质量、大规模、标准化的语料库尤为重要。民......