藏文音节拼写检查的CNN模型

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:yx_maomao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏文音节拼写检查是藏语自然语言处理的基本任务,在藏文文字处理、文字识别、文本生成等领域具有广泛的应用。该文首先针对藏文音节的结构提出了音节向量化的方法,即音节矩阵。然后构建了适合于藏文音节拼写检查的CNN模型,使用1 364 880个藏文音节进行训练。最后对68 244个藏文音节进行测试。实验结果显示,藏文音节拼写检查CNN模型的结果优于规则、RNN和LSTM等模型,不仅对符合藏文文法的音节能正确识别外,而且对梵音藏文音节也能有效识别,正确率、召回率以及F值分别为99.52%、99.30%和99.41%。
其他文献
根据高中有机化学必修与选修模块的课程目标及知识体系特点,结合教学实践,提出在必修模块教学设计中需控制深、广度,有机渗透学科思想和方法的思考,以及对必修与选修模块的衔
第二次鸦片战争以后,随着营口开港,基督教传教士纷纷来到中国东北开展布道活动。从1866年到1931年,在半个多世纪内,传教士们为了顺利发展教务,在东北地区除了积极布道以外,还
以台湾国中的《自然与生活科技》教材为例,从平等尊重、科学严谨、求真务实、客观理性和创新超越5个方面对台湾初中生物教材的人文特点进行分析,以作借鉴。
运用文献资料法、专家访谈法、观察法等研究方法从青少年的生理、心里特点出发分析了青少年桑巴舞教学的注意事项,并在此基础上提出了有关提高青少年桑巴舞教学质量的技巧与方
<正>大部分中学生对"明日复明日,明日何其多。我生待明日,万事成蹉跎!"这首诗耳熟能详甚至倒背如流,但是在中学生的学习和生活中,拖延现象却屡见不鲜。老师布置的作业拖了又
目的疟疾是疟原虫通过媒介昆虫蚊传播的人类最严重的寄生原虫感染性疾病。据WHO最新报告显示,全世界约33亿的人口生活在疟疾风险区,每年近200多万人因其死亡。尽管基于化疗药
<正>一、内涵阐述模型建构是人们按照特定的科学研究目的,在一定的假设条件下,通过研究模型来揭示原型的形态、特征和本质的方法,是以简化和直观的形式来显示复杂事物或过程
<正> 患者女,65岁,1987年头皮部曾患多处块状较厚屑皮损,前额、四肢、躯干部散在蚕豆大小的红色斑丘疹,上覆鳞屑,以臀部较密集,诊断为寻常型银屑病而入院治疗。给予口服维生
本研究采用华东政法大学邬庆祥制定的《中学生一般人际关系测验》和《中学生同学关系测验》进行前测,选取存在人际交往能力困扰的初中生10人,加入2名人际交往能力较好的学生
<正>1 DNA和RNA的结构牛延琴[浙江省长兴县金陵高级中学(313100)]DNA和RNA的结构有什么区别,为什么RNA适合作为信使?为了使学生更容易掌握两者的特征,激发其学习兴趣,我引用