文档结构相关论文
随着信息技术的迅猛发展,各种信息的获取、保存与使用方式给人们带来了极大的方便,但未经版权所有人许可,对数字作品的任意复制、......
XML(eXtensible Markup Language)正在成为Web信息发布和交换的事实上的标准.最近,随着XML在各种应用中得到了广泛的使用,出现了各......
随着应用领域的不断拓展和多媒体技术的日益熟练,人们发现关系数据库的许多限制和不足,许多文档数据用关系数据库存储起来,用户很......
20世纪90年代互联网的成功,对信息检索领域产生了巨大的变革。互联网由于数据量庞大、广告、风格的多样化导致了网页检索的兴起。现......
随着网络越来越普及,传输的信息容量越来越大,其格式也越来越复杂。XML自从诞生以来,因为它具备用户自定义标签、内容和显示分离等特......
随着互联网的飞速发展,互联网已经成为一个巨大的知识库。为了有效地利用互联网上的信息,信息抽取技术应运而生。信息抽取技术属于人......
随着信息技术的高速发展和因特网的普及,Web已经成为人们获取信息的一个重要途径,从网上获取各种各样的知识成为人们日常工作的重要......
Web结构挖掘是从WWW的组织结构、Web文档结构和链接关系中推导知识的过程。目前基于网络的组织结构和链接关系进行挖掘的算法主要......
随着话题检测、社区发现、垂直搜索引擎等Blog研究的展开,对于结构化Blog数据的渴求也日益强烈,然而传统Web信息抽取在丰富灵活多......
由于有着标准化、简洁、结构严谨和可高度扩展等优点,可扩展标记语言XML在飞速发展的互联网中逐渐成为网络数据表示和交换的标准格......
当今整个世界随着计算机和网络技术快速发展,互联网已经成为人类获取信息的最快捷的方法,同时互联网信息也是人类历史上资源最多、......
本文系统地介绍了HTML语言的概念,分类论述了HTML语言的规范及其创作创作技巧,并介绍了创建动态图形的方法。
This article systema......
【目的/意义】文本自动摘要能快速获取文本主要内容,极大提高信息使用效率,帮助人们从信息海洋中解放出来。随着互联网大数据日益......
随着信息技术的发展、网络带宽的不断增加,基于宽带网络的各种应用中包含越来越多的语音、图像、视频等多媒体数据。从而,为用户提供......
随着现代信息技术的飞速发展,GIS作为现代信息技术的重要组成部分,仍然存在着信息数据共享和互操作的问题。这样,使得GIS工作缺乏......
ISO的办公文档结构ODA较好地解决了传统的文档结构定义问题,但是多媒体文档还必须增加一些新需求.文中给出一种描述多媒体文档结构......
XSLT是一种用来转换XML文档结构的说明性计算机语言,随着网络时代的发展,它的应用场合越来越广泛,影响力也越来越大.从不同观点来......
在多媒体信息系统上应用语义网技术的研究多集中于使用注释和本体来改善检索过程,而本文的讨论起于搜索得到的语义图,着力于使用语......
深受国人喜爱的办公组件WPS Office日前发布了最新的2007版本,无论是在界面或是在功能方面,WPS Office 2007都有着相当大的变化,早......
针对不同类别文档可能被表示为相同向量的问题,在研究常用文档特征权重计算方法的基础上,分析文档中特征项之间的相对位置关系,引......
讨论了遗传算法(GA)在信息检索中的应用.首先简要介绍遗传算法并给出了基本遗传算法(SGA)的伪代码描述;其次从查询优化、结构化文档检索......
阐述OpenOffice.org文档的压缩存储方式以及这种方式和其他的多种存储方式相比的优势;针对OpenOffice.org的各种文档描述了它们的结构......
通过分析电子公文在规范性方面的需求,基于我国电子公文格式的现状和特点,提出了一种基于XML的电子公文显现格式,给出该显现格式的文......
XHTML是W3C推荐的新的标记语言.本文介绍了XHTML1.0文档的主要结构,并对该文档结构进行了详尽的剖析,最后给出了一个XHTML1.0文档......
分析了文本控制技术目前在电子政务领域中的作用,阐述文本控制技术中文本的分类及多文档结构文本控制技术中的主要关键技术,总结多......
对PDF文档的处理常常要涉及到文本和图像的提取。文章在深入分析PDF格式和其中采用的各种压缩算法的基础上,实现了PDF文档中JPEG图......
(上接2008年第10期第50页)(4)文档结构标准化设计表3为文档结构标准化设计的示意。...
XML全称EXtensible Markup Language,翻译为扩展的标记语言,是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信......
摘要:语音理解作为人机交互研究的关键技术,近年来受到越来越多研究者的关注。尤其是如何挖掘语音文档中结构信息,用于帮助语音理解方......
阐述了Word文档内部结构特点以及识别文档结构的技术要点,对Delphi控制Word自动阅卷技术的实现技巧给予了详细介绍,并结合示例进行......
针对XML网页特点,提出了计算XML文档结构相似性、文档关键词出现的位置以及关键词频度的方法,根据计算的结果提取XML网页特征,同时设......
本文主要探讨了一种新兴的超文本技术-XML。XML是一种超文本标识语言,它源于SGML,是SGML的一个子集。文中介绍了XML的起源和特点,通过......
本文立足于常见html标签,具体以比较重要的H标签为研究对象,探讨其蕴涵的丰富语义功能,将用户可读性体验与机器可读性紧密结合,进一步......
分析了当前Web信息检索的技术现状,指出检索效率不高的根本原因在于搜索引擎所采用的排序函数和标引词加权技术。介绍了传统的信息......
说到HTML语言,很多初学者看到天书似的代码望而却步,认为这种语言非常神秘,很难学会。其实不然。文章通过对HTML语言重要性、文档结构......
通过对文档在信息领域的重要性和文档本质的归纳,本文阐述了广义上文档的定义及其意义,比较了几种常用的文档定义,解析了上下文环......
根据HTML文档不同标签域的分布特征和对文档内容的代表能力不同,我们提出了一种改进的向量模型(PFTF),并通过trec12的查询实验,比......
介绍了欧洲信息网络服务中心的历史,概貌,特色数据库与检索方法。...
标签PDF文档通过内部标签描述文档逻辑结构信息,并建立了文档逻辑结构与内容之间的联系机制,因而较传统PDF文档有更好的可编辑性与......
目前,互联网正处于高速发展的时期,各个领域都出现了信息爆炸的情况,电子文本逐渐取代了传统的纯手工式的文本,并且越来越多的信息......
HTML5在音频、视频和页面效果等方面给网页结构带来了巨大的变化,对传统网页设计风格和相关理论带来了冲击,HTML5新增的文档元素使......
针对演示文稿文档的功能特点,提出一种理解演示文稿文档的通用文档结构,并在此基础上分析了ODF、OOXML及UOF三类主流文档格式标准对......
本文提出了一种基于 XML的新型文件系统模型 ,实现了数据和数据表现的分离 ,使得各种文档和数据库相互兼容 ,最后给出了该模型在数......