和画语料库的设计与实现

来源 :西北大学 | 被引量 : 0次 | 上传用户:yuandatoy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的飞速发展,使得整个人类社会成为了一个地球村。但是现有的语言却将不同种族与地域的人割裂开来,成为了人类沟通的障碍,世界迫切呼唤新的语言出现。符号因其简单易懂、学习门槛低、生动形象等特点,被网络再次赋予了新的生命力,重新回到了人们的视线。西北大学617实验室提出的地球村语言——“和(Harmony)”即是这样一门基于符号的地球村语言。语料库借助数据库技术,实现语料的存储与处理,是符号语言研究的基础。本文针对地球村语言“和”,设计并实现了其语料库系统——和画。论文的主要工作包括以下几个方面:1.总结了现有语料库技术,分析了当前语料库的研究成果。2.提出了“和”语料库——和画的建设指导原则(CSCH:Construction Specification of the Corpus System of Harmony),包括和画的采集与录入指导原则(CISCH:Collection and Input Specification of the Corpus System of Harmony)、和画的标注指导原则(MSCH:Marking Specification of the Corpus System of Harmony)、和画数据库的创建指导原则(DCSCH:Database Creation Specification of the Corpus System of Harmony)。3.设计并实现了和画系统,实现对符号语料的维护与管理。和画的建设必将为“和”的研究提供资源,以促进符号语料库的建设,进而为推动“和”的传播以及地球村语言的研究做出贡献。
其他文献
模式匹配算法是计算机科学领域的一个经典的研究方向,被广泛地应用在信息检索、入侵检测系统、病毒检测、信息过滤以及生物计算等众多领域中。多模式匹配算法通过遍历一次文
随着“互联网十”时代的到来,家庭业务高速发展,业务需求不断增多。运营商除了开发其业务逻辑外,还要开发业务运营所需的管理支撑部件。为减少管理支撑部件的重复建设、降低
随着互联网技术的日益发展,人们逐渐从信息匮乏的时代进入了信息过载的时代。这种情况下,无论是信息的消费者还是信息的生产者都面临着严峻的挑战。对于消费者,无法快速的从
近年来,城市化进程的推进导致了城市人口迅速膨胀,大城市快节奏的生活使人们对时间观念和办事效率的要求更高。同时,移动通信技术的进步也带动了城市智能公交系统的飞速发展,
网络流量模型是流量预测和网络性能评价的基础,它不仅可以很好地反映真实网络流量的特征而且可以更好地指导与流量有关的实际应用。随着网络技术的飞速发展,网络节点呈现指数
燃料电池作为新能源领域中举足轻重的一个方向,受到人们的广泛关注。氢燃料电池汽车已经有商业化案例,但目前主流的燃料电池催化剂主要原料为铂金,高昂的成本阻碍了其大规模商业化。故设计廉价的燃料电池催化材料是其进一步发展的关键。此外,催化反应的中间产物的吸附能之间普遍存在线性关系(scaling relations)。它简化了催化剂的设计但同时也阻碍了催化剂性能的进一步提高。比如燃料电池阴极的氧还原反应(
近年来,移动互联网产业飞速发展,移动终端产品已逐渐成为人们生活中不可或缺的一部分,人们对移动互联网产品的需求也与日剧增。在如今移动互联网大发展的背景下,广大用户也对
中国女性导演徐静蕾凭借自己执导的电影频频获奖,《杜拉拉升职记》(下文简称《升职》)使其成为首部国产片票房破亿的女导演,这引起了研究者的普遍关注。从2003年第一部自编自导自演的文艺片《我和爸爸》(下文简称《爸爸》)开始,徐静蕾正式投入于电影的制作与拍摄。迄今为止,一共有七部电影作品:《爸爸》、《一个陌生女人的来信女人》(下文简称《女人》)、《梦想照进现实》(下文简称《梦想》)、《升职》、《亲密敌人
随着移动终端的快速发展,智能终端上丰富的传感器设备得到了广泛使用,参与式感知(Participatory Sensing)的概念也随之兴起,在参与式感知环境下,用户即是数据的受益者也是数
高效视频编码H.265/HEVC(High Efficiency Video Coding)是基于图像块的变换编码,由于变换系数的粗量化而产生严重的块效应和振铃效应,严重的影响了观看者的视觉体验。为了提