Web环境下自动获取汉、维语料库 - 论文文献免费下载 - 搜论网

Web环境下自动获取汉、维语料库

来源 :计算机应用与软件 | 被引量 : 1次 | 上传用户：canoe

【摘要】

：

句子级的语料库是机器翻译的重要资源,但由于获取途径的限制,句子级的语料库不仅数量有限而且经常集中在特定领域,很难适应真实应用的需求。根据锚文本信息通过搜索引擎在网络上找到汉维双语平行网站,并下载网站中所有的双语平行网页。提取出有正文的网页,根据html特征,建立html树,提出一种将html树结构作为识别网页正文内容重要特征的网页分析方法,并根据正文内容信息相似性提取网页正文。对提取出的正文进行句

【作者】

：

姜子进吐尔根·依布拉音赛依旦·阿不力米提田生伟

【机构】

：

新疆大学信息科学与工程学院

【出处】

：

计算机应用与软件

【发表日期】

：

2011年12期

【关键词】

：

双语平行语料库双语平行句对正文提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

句子级的语料库是机器翻译的重要资源,但由于获取途径的限制,句子级的语料库不仅数量有限而且经常集中在特定领域,很难适应真实应用的需求。根据锚文本信息通过搜索引擎在网络上找到汉维双语平行网站,并下载网站中所有的双语平行网页。提取出有正文的网页,根据html特征,建立html树,提出一种将html树结构作为识别网页正文内容重要特征的网页分析方法,并根据正文内容信息相似性提取网页正文。对提取出的正文进行句子切分,分别创建句子级的汉、维语料库,为以后创建句子级的汉维双语平行语料库服务。

其他文献

论古文解读在提高高职生文化素养中的作用

为了提高高职生学习古典文化的兴趣,展现古代文学的魅力,使之成为指导高职生“做人、做事、就业”的指南,提高高职生的综合素质,把高职课本上原有的古代文学作品及另外挑选的

期刊

古文解读高职语文教学启迪智慧价值观

平面设计艺术的审美解读

随着人们生活质量和审美观的提升，平面设计在人们生活的地位愈发重要，现阶段的平面设计研究还比较偏重设计方法、元素等方面，缺乏对平面设计艺术审美的更深层次研究，还需要相关研

期刊

平面设计艺术审美解读

试论中国电视节目的娱乐化发展

近几年来,中国电视娱乐节目发展迅速,对电视节目娱乐化的讨论也一时呼高,这是我国广播电视发展到一定阶段的必经之路.不但纯娱乐节目的数量越来越多,种类越来越广泛,而且一些

期刊

经济文化娱乐《快乐大本营》娱乐产业链

对高校艺术设计专业培养目标定位的思考

高校艺术设计专业在近年来得到了较大的发展,但在发展过程中,学校教育与社会要求逐渐出现了各种供需的矛盾,本文希望从改革高校艺术设计专业培养目标定位上进行思考。从根本

期刊

艺术设计社会需求培养目标

如何把握民歌改编的钢琴音乐作品的风格

今天,民歌改编钢琴作品依靠其独具魅力的风格色彩,在世界的音乐舞台上已经占有不可替代的位置,受到越来越多的演奏者的关注,相信它在世界音乐的道路上会更加绚丽、辉煌!

期刊

民歌改编钢琴作品风格

引导学生品读和领悟阅读文本的内涵

本文阐述了引导学生在阅读英语文本的过程中感受、体悟文本内涵，养成良好学习习惯和形成有效阅读策略的途径。

期刊

小学英语阅读教学品读文本

《秦腔主题随想曲》演奏技巧与审美特征漫说

本文从如何教学二胡曲《秦腔主题随想曲》的角度出发,析出一些演奏技巧,详尽的介绍了乐曲手法运用中滑音、揉弦、力度及特征音的处理；并从风格和情感表现等层面入手,解读乐曲

期刊

秦腔主题随想曲演奏技巧审美特征

解读波伊斯作品中的生死意象

波伊斯的艺术观念已广为人知,不论是"扩展的艺术"概念还是"社会雕塑",都有不同程度的阐释.本文立足于前人的研究而不赘述,从波伊斯作品中有关生死意象的解读,阐释他如何用艺

期刊

波伊斯生死意象观念现代艺术

民族地区高校研究生素质提高之探析——内蒙古农业大学为例

民族地区高校高新技术人才的培养有特殊内涵和重要意义,高等教育大众化的当今我国民族地区高校研究生教育面临着前所未有的挑战,作者以内蒙古农业大学为例分析当今少数民族地

期刊

民族地区高校研究生培养质量

推广的几点做法档案工作者教育培训网

本文以朝阳区推广北京市档案工作者教育培训网的经验为基础,就如何推广档案工作者教育培训网提出几点看法.

期刊

档案工作者教育培训网

与本文相关的学术论文