藏文语料库深加工方法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:weicun_weicun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。结合973前期项目《藏文语料库分词标注规范研究》的开发经验,论述了班智达大型藏文语料库的建设,分词标注词典库和分词标注软件的设计与实现,重点讨论了词典库的索引结构及查找算法、分词标注软件的格词分块匹配算法和还原算法。
其他文献
采用液相化学方法并结合热处理及高压等手段制备了纳米材料样品,利用穆斯堡尔效应,X射线衍射和电子显微镜对样品进行了分析,得到了一些有关纳米材料特殊的有意义的结果。
社会主义是历史发展的必然规律.具有"与时俱进" 的理论品质是取得社会主义胜利的根本要求;发展社会主义必须坚持改革,解放和发展生产力;坚持四项基本原则是社会主义必然胜利
本文从直译意译历史背景入手列举了二者的一些定义,试图阐明译界对其界定皆超出了二者的限度,直译意译分别沦为硬译乱译,因而造成论者认识上的偏差。作者进一步论证直译意译的区
经纬仪系统是一个比较复杂的多传感器系统,多传感器信息融合(Multi-seneorDataFusion)是把多种传感器中于一个统一的感知系统(这个感知系统就是多传感器信息融合系统)中,从而有机地综合利用多个传感器来的数据和信息,以便获得对周围环境的更多或更准确可靠的认识.研究多传感器信息融合技术在经纬仪系统中的应用,可以提高仪器的可靠性和自动化程度,以及跟踪精度和实时输出精度.
2月24日下午,市政府法制办组织召开立法条文审查修改会,对总队2009年重点立法项目《重庆市高层建筑消防安全管理规定(草案)》进行了细致审查。
为提高含噪图像的分割效果和分割速度,将非下采样Contourlet变换和粒子群优化算法相结合,提出了一种有效的图像分割方法——IPSOC。该方法首先对待分割图像进行多尺度非下采样Contourlet变换,然后利用其最高级低频系数重构图像,计算重构图像与其均值图像的二维直方图中类间离散度矩阵的迹,并以之作为分割图像的目标函数来搜索最佳分割阈值。为加快阈值搜索速度,以改进的粒子群优化算法作为阈值分割的
对当代大学生心理疾病的问题,在治疗患者同时要对正常人群以预防.“心理健康教育”课并设为大学必修课。学校成立“心理健康指导组”并建立“学生心理健康档案”.完善高校大学生
2008午4月23日下午,十一届全国人大常委会第二次会议分组审议《中华人民共和国消防法(修订草案)》。会上,马福海委员说,消防法颁布实施十年了,这十年中,随着我国经济社会的发展,消防
对高校体育在案质教育的地位和作用进行了论述,并提出了在高校体育教学中如何加强素质教育.
论述了图书馆在校园文化建设中的作用关系,探讨了在市场经济条件下图书馆参与校园文化建设的方法与途径.