中文语料库相关论文
中文的方位短语主要可以由前饰词(如,以、之)与后缀词(如,边、面、头)组合而成,结合了明确的方向指引(如,前后、上下、左右、里外......
互联网带来了信息的急剧膨胀,促成了诸多新型应用需求,如垃圾邮件过滤,垂直搜索引擎,数字图书馆等,这些系统迫切要求对文本进行自动分类......
在中文信息语言处理领域里,以大规模真实文本为基础的语料库研究和知识自动获取越来越受到重视,建设大规模高质量的语料库成为首要......
随着统计自然语言处理技术的快速发展,文本分割日益成为一个重要的研究方向,并在多个应用领域发挥愈来愈大的作用。TextTiling算法作......
情报整编是语言翻译和新闻编写交叉融合的特殊学科专业。从事情报整编工作不仅仅需要一流的外语水平,还需要过硬的中文功底。以语......
目前国际上对于英语的语料库建设已经比较成熟,但对于中文语料库而言,中文信息处理的难度较英语难度更大,因此目前的汉语语料库还......
本研究试图利用多语料库对比的方法,探索英汉翻译中被动句的欧化特征及其对策.研究共使用了自建的词性标注口笔译译文语料库和6个......
建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一.本文......
为了更好地评价阅读理解模型的鲁棒性,基于Dureader数据集,通过自动抽取和人工标注的方法,对过敏感、过稳定和泛化3个问题分别构建......
针对中文金融文本领域的命名实体识别,该文从汉字自身特点出发,设计了结合字形特征、迭代学习以及双向长短时记忆网络和条件随机场......
语音合成,也就是我们熟知的文语转换(TTS),是一种将给定的输入文字转换成人造的智能语音的技术。近年来,随着计算机技术的快速发展......
情感信息抽取是情感分析中的一个重要子任务。虽然该任务已经开展有一段时间,但是面向中文文本的情感信息抽取任务研究才刚刚起步......
信息检索是语料库提供的基本服务之一。随着语料库在汉语词汇学和词典学研究领域中的重要性不断增强,更为符合用户需求的新型语料......