中文网页相关论文
随着互联网技术的迅速发展,网络上的信息资源呈爆炸式增长,万维网己经成为拥有几十亿个web 页面的分布式信息空间。在这海量的数字资......
随着web网页的迅速发展,海量的网络信息大量涌现,如何在繁杂的信息中快速找到需要的信息是网页自动分类研究的重要内容。由于文本分......
本文针对中文网页的分类问题,提出了一种基于代表样本动态生成的快速文本分类方法,并构建了一个网页分类的原型系统。主要工作包括: ......
随着互联网在中国的迅速普及,现在每天中文网页都在以数以万记的速度增加,这无疑给我们带来了巨量信息。那么面对如此庞大的信息,......
随着科学技术的飞速发展,人们进入了数字信息化时代,同时,电子信息急剧膨胀。在这个时代,信息就是财富,信息决定成败。只有及时获取准确......
随着网络和信息技术的迅速发展,特别是Internet的普及,网络信息资源已极为丰富。文本分类将杂乱无章的信息整合起来,方便用户快捷......
随着互联网技术的不断发展,INTERNET上的信息日益丰富,已经成为人们日常工作和生活中获取信息的重要来源。但是,由于INTERNET所固有的......
随着网络信息的急剧增长,在搜索引擎中使用确定的查询词检索时,返回结果一般是一个庞大的相关文档集列表。如何从该列表中快速获得想......
信息技术的发展和互联网资源的迅速膨胀对传统的搜索引擎提出了挑战。在提高搜索引擎对信息的检索效率和用户操作的方便性方面,中文......
互联网技术的迅猛发展,推动了网络信息的爆炸式增长。它容纳了海量的各种类型的数字化信息,包括文本、图形、图像、声音甚至视频。这......
随着信息技术的迅速发展,特别是近年来互联网的普及,网页数量呈指数级增长。为了有效地组织和管理这些海量信息,如何根据网页中的......
互联网的快速发展,使得网络成为民众表达舆情民意的重要平台,随之产生的问题是政府如何及时掌握舆情动态、积极引导社会舆论,以维......
随着互联网的普及,网页上的文本信息呈现出爆炸式增长的趋势。如何索引,检索,管理,挖掘网页上的海量文本信息已经成为计算科学领域......
随着互联网技术突飞猛进的发展,网络规模正以指数级增长。为了更加快捷的找到所需的信息,而不被庞大无序且结构类型多样的信息海洋......
<正>随着缩略词的广泛使用,英语缩略词也逐渐走进人们的日常生活。在广播、电视、杂志、报纸等媒体中,随处可见英语缩略词的影子。......
搜集网上特色鲜明的中文网页,着实是件不容易的事,尽管有网易等中文搜索器相助,但茫茫网海,能淘出几块真金?众多ISP和ICP们都在为......
Oracle Text是一种创建文本搜索和文档分类应用的技术。本文提出了一种基于该技术实现中文网页自动分类系统的解决方案。实验结果......
期刊
自动摘要是自然语言处理中的一个重要但又困难的分支,在Web信息检索中起着重要作用。文章采用拟人思维。提出了一种篇章结构分析和......
实现了一个中文网页采集、过滤和分类系统.文中从网页预处理、特征选择、分类器模型等方面介绍了该系统的具体解决方案.实验结果表明......
本文主要介绍基于内容的网页自动分类系统,具体介绍了类别词典的建造方法,网页超文本类别词切分的方法,中文网页自动分类算法以及......
提出了一种基于语义关联的中文网页主题词提取方法,首先借助滑动窗口和"知网"计算词语间的语义相似度,形成候选名词对集合;然后基......
<正> 在国外的朋友要想查询国内的网站,或者通过搜索引擎查询国内相关产品信息可以说是很困难的,虽然Win-dows系统支持多语言功能,......
针对中文网页分类技术中的一些特征选择方法存在的问题.分析了常用的网页分类特征选择方法,提出了一种比较适合中文网页分类的特征......
针对不同类型的中文网页及网页中含有文字的图片,提出了提取文字信息的几种方法,解决了特殊中文网页中文字信息无法提取的问题。......
本文以实践经验为基础,对网页的源程序公共结构进行了分析,并充分考虑到中文网页的文字特点,给出了一种中文网页的分类方法与实现......
你的网上旅程是否因为碰到了不太熟悉英文字母而变得磕磕绊绊,也许到那时你才会恨自己的当初为什么不好好学习英语呢?其实,这个问......
在Internet网络信息传递中如何将明文变换成密文 ,或将密文变换成明文 ,即保护信息在传递中不被他人窃取或修改是一个需要解决的问......
建立殷朝的商汤,是位了不起的人物,很关心百姓的疾苦。 他曾对大臣们说:“一个人想知道自己的模样,可以对着水面看自己的脸。如果想......
阐述了现存欧洲信息编码与亚洲信息编码的多样性和不兼容性 ,为今后有关学者开发统一码时要顾及的问题提供了参考.......
探讨与分析中文网页出版中无法显示生僻字的问题。提出生僻字问题的理论模型,分析了常见的生僻字解决办法所存在的问题,并指出解决......
通过对随机采集的1 800篇涉及经济、心理、文学、教育4个学科类别的网页进行人工自由标引、人工打分、词频统计,并进行统计数据的......
集中式搜索技术有选择地找出与预定义主题集相关的页面,与传统搜索引擎相比具有可针对个人喜好定制、规模小、索引量少、更新查询......
介绍了中文网页分类的概念和过程,分析比较了中文网页分类的主要方法和关键技术,简述了实验数据集和实验方法,并讨论了网页分类研究存......
网络被称为全球性的媒体,我们的关注也是全球性的.但是,出于自身的需要,我们对来自世界各个不同地方的信息关注的程度是不同的.那......
<正>泰伦斯·马力克比他的电影更难以琢磨,他的电影还能被观众看到,而他本人则是个彻彻底底的隐士。在《生命之树》之前,维基百科......
<正>网络上前阵子流行一句话:"如果你爱他,把他放到‘人肉搜索’上去,你很快就会知道他的一切;如果你恨他,把他放到‘人肉搜索’上......
站点:足球之夜网址:http://www.cctv.com.cn/sports/football简介:中央电视台“足球之夜”栏目的网络版,电视上的精彩内容尽收于......
随着计算机和互联网技术的飞速发展以及广泛应用,万维网已经成为世界上最大的信息源,如何在这海量信息中搜寻所需要的信息、获取信......
为了提高关键词的提取准确率,在对现有关键词抽取方法进行研究的基础之上,针对影响关键词提取准确率的分词技术、同义词现象等难点......
卡斯帕罗夫够聪明的吧,还是败在了“深蓝”手下。其中一个重要原因是“深蓝”收集了近百年来世界顶级棋手对弈的10亿个棋局,这是一个庞......
目前,随着Internet的普及,网络已成为一个巨大的信息源。如何在这海量信息中搜寻所需要的信息、获取信息的主旨,如何快速阅读每天......
自动文摘是指由计算机将文本的中心思想或用户所需要的内容,用相同于或不同于原文的句子自动提取出来。自动文摘的生成过程,可分为......