藏文短语及其嵌套短语的提取

来源 :中国中文信息学会二十五周年学术会议 | 被引量 : 0次 | 上传用户:saosaoxp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种自动提取藏文短语及其嵌套短语搭配的算法,它通过采用基于统计长短语内词语之间的触发共现和基于句法特征规则相结合的处理策略,利用数据挖掘中的Apriori算法和FTP Tree数据存储结构,克服了N-gram统计语言模型在藏文短语搭配提取中没有考虑语言本身结构特性的缺陷,实验结果表明,短语提取的准确率和召回率都有很大的提高.
其他文献
中文名实体识别是自然语言处理当中一个富有难度和挑战性的课题.本文提出了一种改进的基于TBL的后处理技术,它对学习到的规则集合进行优化,极大地提高了单个分类器的识别效果
会议
一口气读完《彭德怀自述》,思绪万千,感慨无穷。历史何等公正,人民何等幸运,十年动乱之后,终于能读到这样一本惊心动魄、震古烁今的《自述》。 Breath read “Peng Dehuai
随着肿瘤免疫治疗的开展,免疫相关不良事件的发生率越来越高,其中免疫检查点抑制剂(immune check point inhibitors,ICI)引起的心肌炎的发生率为1%左右[1].心肌炎的发生频率虽
尼达尼布是一种三重血管激酶抑制剂,可靶向抑制血管内皮生长因子受体、血小板衍生生长因子受体和成纤维细胞生长因子受体通路,避免肿瘤转向正常逃逸机制,已被欧洲药品管理局
聚乙二醇重组抗血友病因子(Adynovate)建立在重组抗血友病因子(Advate)基础上,是聚乙二醇化的重组凝血因子Ⅷ,用于成人和青少年血友病A患者出血发作的按需治疗与控制以及常规
人名识别是自然理言处语领域的一个重要的子任务.实例学习是机器学习中的一种常见的方法.本文在对大量语料的语言现象的统计与分析的基础上,提出了一种用实例描述语言现象,用
本文从藏语词类的功能和性质提出了一个藏语词类的基本标记集,以期为藏语词类标注的自动处理和人工校对提供一个统一的标注标准.
目的 系统评价曲妥珠单抗-美坦新共轭复合物(T-DM1)治疗人表皮生长因子受体2(HER-2)阳性乳腺癌的有效性和安全性.方法 计算机检索PubMed、Embase、Cochrane Library、中国生
HNC是Hierarchical Network of Concepts(概念层次网络)的简称,是关于自然语言理解处理的理论框架,是面向整个自然语言理解处理的基础理论框架. 发达国家对自然语言理解己
会议
2003年,在国家"863"软件重大专项和中科院知识创新工程西部行动计划项目的资助下,中科院软件研究所联合西藏自治区藏语委办、西北民族大学、新疆大学和内蒙古科立公司等单位,
会议