中文文本数据库关键技术及其在Web中的应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户:cc249879369
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了一个树型的基于∑<2>邻接矩阵全文索引、中文文本逻辑结构与内容的文本对象数据库模型及其创建算法,建立了相应的SQL查询机制.针对中文文本文件的句子中常包含有一些有价值的结构化数据,该文提出了基于种子的方法进行中文文本信息的匹配模板抽取模型,并采用基于遗传算法机制进行优化.在此基础上提出了一种面向文本数据的查询机制.同时将信息抽取建立在全文检索的基础上,提高了匹配模板抽取的效率及对文本检索的效率,为海量文本数据库的实现在查询效率上提供了保证.该文针对全文索引所存在的这些缺陷,提出了一种基于操作转换以及乐观锁的实时全文检索并发控制机制.针对并发操作中可能存在的因果冲突、意向冲突、多版本冲突,通过操作转换、加锁等方式为全文索引的并发控制机制提供了解决方案.另外该文利用查询采样、网页分类的技术,自动创建类似Yahoo!的分类层次的资源特征查询机制,建立了一个树型的Web资源特征检索系统,避免了人力的大量浪费.
其他文献
该文对VPN的协议体系,实现机制,以及安全机制进行了深入的分析和论述.IPSEC协议是VPN协议体系的核心,它弥补了IP层的安全缺陷,定义了针对IP分组的加密部件和验证部件,以及在
衡量视频服务器性能的标准主要是可同时服务的客户数、并发的数据流量以及视频的服务质量等.如何在现有的硬件条件下,提高视频服务器的性能,一直是学术界和服务器厂商所关注
随着互联网迅速的发展,数据量呈指数增长,用户对海量数据的存储和处理需求加大,传统的数据库集中存储已经不能满足需求,利用网络进行分布式存储成为趋势。如何在复杂的网络环
该文针对一类特定的在大规模集成电路和超大规模集成电路中有重要应用的平面布局问题,系统地论述了作者对于该问题的研究成果.提出了对于平面布局问题的一系列动作定义.具体
对象关系数据库技术是面向对象技术与关系数据库技术的完美集成.它将传统关系数据库的优点与处理复杂数据类型的能力、面向对象建模能力与可扩展查询语言工具相结合,已逐渐成
该文首先介绍了数据仓库、OLAP和数据挖掘的基础理论,然后研究了OLAM的一般模型,提出一种OLAM的实现,最后,介绍了OLAM技术在财务分析系统中的应用.该课题研究的第一个成果是
目前在数字图书馆领域存在两个难点问题:异构信息仓储的互操作;缺乏搜索有用信息的信息过滤方法.因此设计了基于多层代理的数字图书馆模型MADL,模型完全由多个独立自治的代理
该文首先在第一、二章对现有的各种IBR(Image-based Rendering)基于图像的绘制技术进行了简单介绍和分类比较,主要包括几何表示形式的IBR,图像表示形式IBR以及全视函数表示形式
Peer-to-Peer是近年来国际上研究得比较热门的一个题目.它不仅掀起了一场前所未有的资源共享热,而且冲击了当前Internet环境下Client/Server模式.该片论文讨论了Peer-to-Peer
角色动画是计算机三维动画的一种,它描述一个或多个角色的运动过程。近年来,计算机软硬件能力的不断提升以及计算机图形、图像处理技术的不断发展完善很大程度上推动了角色动画