潜在语义索引相关论文
全球恐怖主义因其异常活动而导致经济损失,网络战争和网络犯罪,给刑事司法系统带来了挑战。因此,通过准确地从大数据中提取犯罪信......
潜在语义索引被广泛应用于信息检索、文本分类、自动问答系统等领域中.潜在语义索引是一种降维方法,它把共现特征映射到同一维空间......
主成分分析是模式识别中经典的降维技术.本文尝试把它的一个变种算法--核主成分分析,与k-NN分类模型结合,应用到文本分类中.核主成......
本文是在对几种比较经典的聚类算法对比分析的基础上,利用自组织映射网络在拓扑保序和抗噪声能力等方面的优势,以自组织映射模型作为......
Web信息急速膨胀使搜索引擎专用化成为发展趋势.有效定向采集过滤专业信息成为搜索引擎一个重要研究方向.本文提出一种基于潜在语......
通过分析潜在语义索引的各种模型提出一种新的潜在语义差异模型。将医学网页中的文本抽取出来并分别采用全局模型、局部模型和差异......
信息检索本质上是语义检索,虽然现有的搜索引擎数目众多,但其采用的信息检索技术大多是基于独立词索引,由于同义词和多义词的大量存在......
本文改进了一种基于语义的、层次的、以集簇标签为向导对搜索引擎返回的结果进行层次聚类的算法。算法的主要思想是首先推导出可以......
随着文本信息的快速增长,特别是Internet上在线信息的增加,文本(网页)分类显得越来越重要。由于文本分类有助于用户有选择地阅读和处理......
从20世纪90年代以来,伴随互联网的飞速发展,出现了大量的电子文档。如何对这些无结构的自然语言文本进行有效的管理和使用成为一个重......
文本自动分类是组织和管理文本信息的有力手段,可以在较大程度上解决信息杂乱无章的问题,使用户更容易更准确地定位所需的信息。目......
模式匹配在许多领域中扮演着重要的角色,如模式集成、数据仓库、电子商务、数据集成等。但是由于模式表达形式的多样性、模式异构......
Internet技术的迅猛发展和空前普及给人们带来了诸多方便的同时,也带来了很多问题。网络在传播有用知识和信息的同时,也正在被不法分......
潜在语义索引模型(Latent Semantic Indexing, LSI)是经过实验验证的文本分类技术中行之有效的维数约简算法之一。潜在语义索引模......
随着网络信息的飞速增长和搜索引擎等技术的日趋成熟,人类社会所面临的主要问题已经不再是信息匮乏,而是如何提高信息获取和信息访......
在互联网技术高速发展的时代,各种数据充斥在网络上,数据的信息量繁杂,人们对信息数据的质量提出了更高的要求。如何有效获取用户......
随着信息技术的发展,人们需要对大量的文本资源进行有效的组织,以利于主题发现、信息检索等。于是,文本聚类技术应运而生,它是自然......
随着科技的进步,科技创新越来越受重视,但目前科技项目评审缺乏科技创新参考指标,因此需要对以往科技项目创新性指标进行分类,提高......
网络已经发展成为人们生活的重要部分,网络上存储的信息是海量的,而且处于不断变化中。网络用户期望得到个性化的服务,网络服务端......
针对向量空间模型表示法的局限性,采用潜在语义索引在语义层面进行处理,是近几年提出的一种文本表示方法。潜在语义索引是利用统计......
自然语言中普遍存在着同义词和多义词现象,致使人们很难通过以词形匹配的关键词检索寻找到真正需要的网络资源。潜在语义索引通过......
对等计算(Peer-to-Peer Computing,P2P)是在互联网上实施网络计算的一种新的计算模型。P2P打破了传统的Client/Server(C/S)模式,网......
本文提出了一种基于潜在语义索引的启动子预测方法,给出了算法的详细描述,利用该算法对6个基因序列上的启动子进行查找,实验结果比现......
支持向量机是文本分类领域在广泛采用的分类模型,应用于支持向量机的特征降维方法也成为了研究热点.本文考察了信息增益、文档频度......
伴随着网络的迅猛发展,人们要接受的信息数量也成几何级数的增长。面对Internet中海量的、纷繁芜杂的信息,如文本信息、声音信息、......
随着计算机和通讯技术的发展和进步,人类社会进入了信息社会。Web网页是网络信息传播的主要途径之一,随着网络技术的发展,web网页信息......
针对潜在语义索引(Latent Semantic Indexing, LSD计算成本很大,不利于扩展信息检索领域的特点,提出引进图论中的层次搜索方法(Lev......
期刊
随着计算机技术和信息技术的不断发展,尤其是互联网技术的日新月异,使得人们能获得信息成几何级飞速增长。但是面对着这些浩如烟海而......
众所周知,在信息检索领域有两种基本的语言现象一直困扰着传统的词汇匹配方法,即同义和多义现象。同义现象影响查全率,多义现象影响查......
20世纪90年代以来,Internet得到飞速发展.作为最大的信息集散地,Web上具有海量的信息数据,成为人们工作与学习的平台之一.如何从数......
本文分析是文本处理领域中的重要内容,它可以有效地改进文本检索、文本过滤以及文本摘要的精度.本文简要描述了文本的物理结构和逻辑......
在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳.而考虑了文本特征及分类信息的......
为建设和谐文明的网络环境,提升对网络不良文本信息的识别和应对能力。文章使用一种新颖的基于增长型自组织特征映射(GSOFM)和潜在语......
提出了一种基于潜在语义索引(LSI)的“垃圾”邮件过滤方法,讨论了邮件概念空间的构造,该空间中邮件相似度的计算和“垃圾”邮件的过......
特征选择和分类算法是网页文本聚类中最关键的技术。提出对网页文本提取特征值后,利用潜在语义索引对网页文本降维,采用支持向量聚......
综合文献自身客观价值和相对于查询用户的主观价值,提出了基于用户行为分析的文献阅读价值评估方法。首先,分析用户行为并构建下载......
LDA没有考虑到数据输入,在原始输入空间上对所有词进行主题标签,因对非作用词同样分配主题,致使主题分布不精确。针对其不足,提出......
视频语义概念检测是跨越"语义鸿沟",实现基于语义的视频检索的前提。其中,视觉词典法是一种有代表性的方法。针对视觉词典法的两个......
自动文摘是自然语言处理领域的一项重要的研究课题。提出一种基于潜在语义索引和句子聚类的中文自动文摘方法。该方法的特色在于:......
针对源代码中一些非结构化的自然语言描述信息进行语义聚类,辅助开发人员开展程序理解。主要利用自然语言处理技术对程序中的标识......
展示了一种从大规模文本中学习文本索引的深层图形模型,深层图形模型采用自编码器作为基础结构。该图模型最终输出的值具有较强的......
研究了潜在语义索引在中文自动问答系统FAQ库构建中的应用,并着重阐述了句子相似度的计算方法以及使用LSI对FAQ库去重的实验选取方......
启动子是基因前面的一个短序列,定位启动子即能找到基因,因此启动子的识别具有重要意义.潜在语义索引差异模型(DLSI)能够扩大类间的......
目前P2P网络中的资源发现已经成为一个重要的研究课题.对P2P网络常见的几种搜索方法进行了介绍,包括非结构性的搜索方法和结构性的搜......
传统向量空间模型信息检索技术,只是统计关键词在文档中出现的频度,检索结果不能反映出文档的相关性.为了解决关键词检索时潜在语......
将潜在语义索引(LSI)应用于垃圾邮件过滤领域,并将其与向量空间模型(VSM)和经典的邮件过滤器SpamAssassin系统进行比较.另外,对基于词提取......