一个面向信息抽取的中英文平行语料库

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:shz0414
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
除了机器翻译,平行语料库对信息检索、信息抽取及知识获取等研究领域具有重要的作用,但是传统的平行语料库只是在句子级对齐,因而对跨语言自然语言处理研究的作用有限。鉴于此,以On—toNotes中英文平行语料库为基础,通过自动抽取、自动映射加人工标注相结合的方法,构建了一个面向信息抽取的高质量中英文平行语料库。该语料库不仅包含中英文实体及其相互关系,而且实现了中英文在实体和关系级别上的对齐。因此,该语料库将有助于中英文信息抽取的对比研究,揭示不同语言在语义表达上的差异,也为跨语言信息抽取的研究提供了一个有价值的
其他文献
我的家乡有一条小河,它虽然没有长江的滚滚之势,却在岁月中流淌着只属于它的四季之歌。  春天的小河唱着一首生命的歌。萬物复苏,河岸上的小草从泥土中拱出来,冒出了嫩绿的芽,拥抱着春天的阳光。阳光照射着小河,薄薄的冰面发出细碎的咔嚓声,一股清澈的河水涌了出来,汩(gǔ)汩作响,春天的音符飘满了整条小河。  夏天的小河唱着一首快乐的歌。南风吹过绿油油的草地,掀起一片刷刷的声音。河水欢快地流动着,撞击到石头
未来认知无线网络中,特定区域的频谱拥有者控制大量不同带宽的频谱带并为不同的认知用户提供通信服务,如何在这多个频谱服务提供者和多认知用户共存的环境中提高动态频谱访问的
“知识大使”卡布的职责是帮助世界上的孩子好好学习。由于现在不爱学习的小朋友越来越多,卡布的工作担子也越来越重,他需要找一个勤奋好学的小朋友,协助他向世界上所有小朋友宣传知识的力量,让所有小朋友都喜欢上学习。  得到这个消息的小朋友,都希望自己能当上“知识使者”,都踊跃参加,其中有成绩最好的婷婷和莫妮,她俩也是学习上的竞争对手。但是,要当上“知识使者”,必须是真正勤奋好学和善良勇敢的孩子,因此要当上
虽然打蜡不需像洗车那么频繁,但是要想车身漆面保持光亮如新,还是需要定期地进行打蜡抛光。那么如何才能做到轻松打蜡呢?看完下文或许对您有所帮助。涂蜡时机的选择涂蜡时机
随着融合型网络的发展,服务质量(包括可用带宽、端到端的时延、抖动和丢包率)对一些实时数据流应用(语音流、视频流等)越来越重要。由于传统的WRR算法只能满足各个应用队列的公平
图像特征点匹配在视觉系统中有广泛的应用。针对加速分割测试特征FAST和二进制稳健基元独立特征BRIEF算法中存在的问题进行改进。首先,在FAST算法中使用简化模板提取图像特征点,通过构建图像金字塔实现尺度不变性。接着,根据人类视觉系统原理改进BRIEF算法的点对采样模式,并通过特征点方向的计算实现图像的旋转不变性。最后,使用易于计算的海明距离度量各特征点的相似度实现特征匹配。实验表明,提出的图像匹
每个人都会做梦,每个人都会有自己的梦想。懒羊羊的梦想是能够在青青草原上品尝美食;熊大、熊二的梦想是保护大森林。以前,我的梦想是得到一个好玩儿的玩具,是考试取得好成绩……
2005~2006年度,二院《工艺信息》工作会于2007年1月17日至18日在北京召开。会议由编委会副主任娄军主持,编委会主任吴宝林作了重要讲话。会上,六九九厂副厂长王致岭致开幕词;
Event-B是一种基于集合论和谓词逻辑的形式化系统语言,能够采用精化策略为系统建立逐渐精化的模型。提出了如何将Event-B应用到实际工业领域的方法,包括重写需求、建立抽象模
结合功能角色单元的拓扑关系和封装要求,提出基于黑盒模型的封装方式,实现了更高功能层次的故障分析,并针对实际案例说明了故障分析过程。研究表明,提出的方法有效地拓展了功能角