搜索筛选:
搜索耗时1.6528秒,为你在为你在102,285,761篇论文里面共找到 16 篇相符的论文内容
类      型:
[学位论文] 作者:加羊吉,, 来源:西北民族大学 年份:2011
语言是人类社会最重要的交际工具,它跟社会相互依存、相互影响。词汇作为语言的三大要素之一,相对于语音和语法更具有灵活性、敏感性,也最能体现语言发展状况和时代发展的特征。......
[期刊论文] 作者:加羊吉,达哇彭措,, 来源:科技信息 年份:2010
藏语跟国内国外的文化互相碰撞,产生了一大批反映社会生活和时代变革的新词语,这些新词语中有很多外来词。外来词是一种语言现象,也是社会现象的反映。它的词汇内容日益丰富,...
[期刊论文] 作者:加羊吉,达哇彭措,, 来源:西北民族大学学报(自然科学版) 年份:2010
藏语是藏民族通用的语言,是藏族人民最重要的交际工具.随着社会的发展、时代的变革,藏语中出现了大量表达新事物、新现象和新观念的新词语.文章根据新词语的特征和藏语构词法...
[期刊论文] 作者:窦嵘,加羊吉,黄伟,, 来源:长春工程学院学报(自然科学版) 年份:2010
提出了一种基于统计与规则相结合的藏文人名自动识别方法。该方法充分挖掘了人名与上下文信息的关联程度,引入互信息对关联程度进行了定量的描述。根据大规模语料(30.2 M文本语料)的统计数据所建立的规则极大地提高了识别算法的准确率;在处理汉族音译人名情况时......
[期刊论文] 作者:徐涛,于洪志,加羊吉, 来源:计算机工程 年份:2014
藏文文本表示是将非结构化的藏文文本转换为计算机能够处理的数据形式,是藏文文本分类、文本聚类等领域特征抽取的前提。传统的藏文文本表示方法较少考虑特征项之间的关联度,容......
[期刊论文] 作者:徐涛,加羊吉,于洪志, 来源:云南大学学报:自然科学版 年份:2012
藏文句子断句是藏文信息处理领域的难点之一,也是藏汉机器翻译、藏文文本分类等工作的一项重要基础性研究.提出了一种统计与规则相结合的藏文句子自动断句方法以解决藏文标点...
[会议论文] 作者:徐涛,于洪志,加羊吉, 来源:中国中文信息学会,上海交通大学 年份:2012
藏文文本表示是将非结构化的藏文文本转换为计算机能够处理的数据形式,是藏文文本分类、文本聚类等领域特征抽取的前提。传统的文本表示方法并没有考虑特征项之间的关联度,或者只是简单的计算相互问的共现,造成了语义的损失,很难准确的表示文档。本文首先提取文本中......
[期刊论文] 作者:江涛, 袁斌, 于洪志, 加羊吉,, 来源:中文信息学报 年份:2017
中英文微博大都以单一语种来表述,而将近80%的藏文微博都是以藏汉混合文本形式呈现,若只针对藏文内容或中文内容进行情感倾向性分析会造成情感信息丢失,无法达到较好效果。根...
[期刊论文] 作者:加羊吉,李亚超,于洪志, 来源:西北民族大学学报:自然科学版 年份:2016
文章就藏文人名本身的特性分析了人名识别的难点,提出了CRF与规则相结合的藏文人名识别方法.该方法首先以CRF作为机器学习模型,充分利用藏文人名的各类特征,然后针对人名不能...
[期刊论文] 作者:马宁,李亚超,于槐,加羊吉, 来源:中央民族大学学报:自然科学版 年份:2015
确定实体之间的关系有助于更好的理解文本内容,通过实体关系模板可以从海量无结构的文本中获取大量的实体关系,并予以结构化.本文针对互联网藏文文本的特点,通过对藏文实体进行模......
[期刊论文] 作者:李亚超,江涛,于洪志,加羊吉, 来源:西北民族大学学报:自然科学版 年份:2011
针对跨语言检索中查询翻译歧义问题,文章从藏汉跨语言检索的特点出发,采用了平衡翻译(BalancedTranslation)方法,减少了歧义翻译数量,提高了翻译的准确度.在文档索引上,为了弥...
[期刊论文] 作者:李亚超, 江静, 加羊吉, 于洪志,, 来源:中文信息学报 年份:2015
TIP-LAS是一个开源的藏文分词词性标注系统,提供藏文分词、词性标注功能。该系统基于条件随机场模型实现基于音节标注的藏文分词系统,采用最大熵模型,并融合音节特征,实现藏...
[会议论文] 作者:徐涛[1]于洪志[2]加羊吉[1], 来源:第六届全国青年计算语言学会议 年份:2012
藏文文本表示是将非结构化的藏文文本转换为计算机能够处理的数据形式,是藏文文本分类、文本聚类等领域特征抽取的前提。传统的文本表示方法并没有考虑特征项之间的关联度,或者......
[期刊论文] 作者:加羊吉, 李亚超, 宗成庆, 于洪志,, 来源:中文信息学报 年份:2014
藏文人名识别是藏文信息处理领域研究的难点之一,其识别效果直接影响到藏文自动分词的精度和相关应用系统的性能,包括藏汉翻译、藏文信息检索、文本分类等.该文在分析藏文人...
[期刊论文] 作者:李亚超,加羊吉,宗成庆,于洪志, 来源:中文信息学报 年份:2013
藏语自动分词是藏语信息处理的基础性关键问题,而紧缩词识别是藏语分词中的重点和难点。目前公开的紧缩词识别方法都是基于规则的方法,需要词库支持。该文提出了一种基于条件...
[期刊论文] 作者:李亚超, 加羊吉, 江静, 何向真, 于洪志,, 来源:中文信息学报 年份:2017
藏文分词是藏文信息处理的基础性关键问题,目前基于序列标注的藏文分词方法大都采用音节位置特征和类别特征等。该文从无标注语料中抽取边界熵特征、邻接变化数特征、无监督...
相关搜索: