面向文本语料库的数据模型及其查询问题

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:jzl_root2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语料库为语言研究和自然语言处理提供基础数据服务.传统语料库数据缺乏规范的数据模型,导致无法科学的评价查询结果。大大降低了数据可用性.针对该问题,提出一种面向语料库的数据模型,并讨论了其上的查询问题.首先,给出语料库数据的形式化定义,其次,在关系模型的基础上提出一种面向文本语料库的数据模型,并证明了模型的完备性,在此基础上,扩展传统语料库以KWIC(Key WordIn Context)输出为中心的查询语义,定义了语料库数据的查询问题KWIC—EXTENTION.最后,证明这些查询问题的数据复杂度,其中,正
其他文献
自从2004年IDC提出UTM的概念以来,在其后的四年间,UTM的发展可谓迅速,在美国市场,UTM的市场份额已经超越防火墙,成为安全网关市场的主流.在中国,UTM的远大前程也展露无疑:根
对转基因小鼠能否将外源基因遗传给后代以及如果能又将遵循怎样的遗传规律的问题进行了研究。在本研究中,2只转基因母鼠与非转基因公鼠交配,妊娠足月分娩后分别得到7 只和8只仔
随着我国现代化建设水平的不断提升,现代建筑技术的管理效果与质量也逐渐引起了相关业内人士的广泛关注.本文立足于现代建筑技术管理现状,首先分析了现代建筑技术管理对工程
通信是多机器人之间进行信息交互并实现协作的基础。因此,了解与考虑多机器人系统的通信性能是构造具有实用价值的多机器人系统的前提。对基于IEEE802.11的无线通信协议的不同标准进行了研究,介绍了无线局域网(WLAN)的主要因素对多机器人系统通信性能的影响,并通过大量实验测试了目前最常用的基于802.11g的WLAN的延时特性。本研究结果将对构建基于WLAN的多机器人通信系统有一定的参考价值。
随着计算机和互联网技术的发展,电子信息工程在各行各业得到了重视和广泛应用.本文以浅析计算机网络技术在电子信息工程中的实践为题,对电子信息工程的概念以及电子信息工程
建设工程规划放线是加强城市规划管理的一项重要基础工作.本文结合苏州市规划放线测量的要求和平时放线测量质检工作碰到的一些问题,通过对放线资料、内外业数据、施工图和总
期刊
随着科学技术的发展,计算机网络技术逐渐的更新,使得计算机进入了千家万户,人们在使用计算机的过程中,出现了大量的信息,这就使得当前进入了大数据时代.而随着大数据时代不断
随着一亿美金的私募资金入账广东粤海饲料集团,水产饲料行业再添一名重量级的选手,粤海也得以华丽转身,有望改变此前略显被动的市场处境,从而加快迈入水产饲料第一梯队行列的
(1)防铁制件生锈.农机具大部分零部件是金属制造的,如保管不善很容易生锈,铁制件生一次锈剥一层“皮”,会缩短使用寿命.因此,对未涂油漆的铁制件在休闲期应清洗干净,涂上防锈