潜在语义分析相关论文
近几年来,文本聚类技术作为机器学习领域一种无监督学习的方法,也越来越成为数据挖掘领域备受关注的技术之一。将小规模的文本数据聚......
基于互联网金融提供的客户借款描述,通过潜在语义分析挖掘借款描述文本内容的主题,运用二元分位数回归分析借款描述对互联网金融信用......
随着计算机和网络技术的不断发展,以自然语言为特征的领域文本信息不断喷涌,这些文本信息是进行科学研究、企业竞争情报研究的宝贵......
基于近红外光谱(NIR)和潜在语义分析(LSA)方法,对5种典型壮阳中药材进行分类鉴别研究。利用潜在语义分析对光谱预处理后的5种壮阳中药材......
【目的】利用关联数据的机器可读、语义表示、关联描述和网络资源属性的优势,弥补学术资源网信息组织的不足,为相似文献发现提供支......
本文提出潜在语义分析的Web文本分类方法,该方法认为在词汇之间,词汇与文本之间存在着某种上下文的关系,多篇文本与多个词汇可以由......
互联网的迅猛发展和广泛普及,使人们可以方便地从网络上获得信息。但是网络信息的爆炸性增长,又使得人们准确、快速地获得价值信息......
学位
本文首先对Web挖掘流程以及Web挖掘分类及各自的研究现状及发展进行一个概括地介绍;然后结合汉语自身的相关特点较为详细地分析......
随着互联网的发展,当前出现的Web标准如WSDL,SOAP,UDDI,DAML-S,使得Internet成为一个异构的、具有互操作性的Web服务的海洋,从而使应用程......
机器学习通过研究计算机如何模拟人类的学习行为以获取新的知识或技能,重新组织已有的知识结构达到不断改善自身性能的目的。但是......
现今存在着大量丰富的语音信息,需要对其进行有效地利用和开发。语音文档自动摘要就是能满足这种需要的一项很实用的技术,它能方便......
一篇文档通常涉及多个子主题,然而传统的文本处理系统如信息检索和文本摘要以整篇文档作为基本处理单元,隐性假设文档主要讨论一个主......
数据库关键词的语义检索作为数据库关键词查找的一个重要研究方向,在近几年已经得到了广泛关注。与精确查询相比,语义检索能够发现......
随着Internet技术的迅速发展,Web资源的更新频率令人瞠目结舌。然而,在Web信息资源迅猛发展的同时,人们不能忽视信息极大丰富而知......
浩如烟海的互联网信息推动了搜索引擎的普及和应用,同时也促进了搜索引擎技术的蓬勃发展。当今搜索引擎的各项技术日趋成熟,学术界......
自动文本分类是信息检索领域的基本任务之一。随着互联网上的信息量呈爆炸性增长,人们很难从大量的文本信息中迅速有效地提取出所需......
随着互联网的发展,人们在习惯于通过互联网来获取信息的同时,也发现由于互联网中信息量的庞大及其无组织性,如何高效地取得有用的......
大词汇量连续语音识别(Large Vocabulary Continuous Speech Recognition,LVCSR)是语音识别研究的重点和难点之一,其涉及了声学模......
专利文献包含重要的研究成果,内容广泛新颖,技术细节描述详细,是世界上最新技术信息的重要来源。专利文献的有效分析对提高企业市......
图像场景可能由多个对象(比如:草地,马路,建筑物)所组成。给定一组图像,我们的目标是利用无监督方法发现每一幅图像所包含的对象,然后根......
现代网络和多媒体技术给人们带来资源共享的同时,色情、暴力等不良信息极大危害青少年的健康成长。因此,如何快速有效的监测和过滤网......
潜在语义分析(LatentSemanticAnalysis,LSA)是一种通过统计分析挖掘出文档和词语之间潜在含义的经典算法,最初用于解决信息检索中的......
随着Web应用的蓬勃发展,现实世界中存在大量的对象,它们相互之间存在各种各样的交互关系,形成一个庞大的、相互联系的复杂网络,我......
随着网络信息技术的发展,互联网数据及资源大幅增加,并呈现出海量特性。为了有效地管理和利用这些海量分布的信息,基于内容的信息......
随着多媒体技术的发展,数字图像以其便于传输与保存逐渐融入人们的日常生活中,成为人类信息获取的重要来源,视频监控系统也得到了......
随着互联网络的普及,人们获取信息的方式逐步从报纸、广播和电视等传统媒体向互联网转变。越来越多的人热衷于借助论坛、博客和微......
随着用户对产品设计多样化和个性化审美需求的提高,产品外观的美观性、象征性等已成为消费者关注的焦点。由于产品色彩-材料-表面......
随着GPS/北斗定位技术、车联网技术、5G等先进前沿信息技术的飞速发展,海量的交通时空轨迹大数据得到了迅速积累,其蕴含着极其丰富......
当前信息检索技术面临着各种信息资源更新越来越快,用户检索结果要求越来越精确的严重挑战,如何有效地找到所需信息因而成为了一个......
随着信息技术的发展以及网络的普及,越来越多的信息充斥在网络上,人们可以不受时间、空间限制的获取信息。然而信息的“爆炸式”增......
专利分类可以加快对专利文献的检索速度,方便对专利文献的管理,有着十分重要的作用。近几年,自然语言处理以及信息检索技术的发展,......
随着计算机技术和信息技术的不断发展,尤其是互联网技术的日新月异,使得人们能获得信息成几何级飞速增长。但是面对着这些浩如烟海而......
随着网络信息技术的飞速发展,农业信息化的建设、服务水平得到了极大的促进与提高。互联网中海量、重复的农业信息为从事农业领域的......
【目的】针对现有预警体系多以企业自身和监管部门为主体、忽视网络舆情,导致预警力度不强、缺乏透明度及敏感性、使突发性安全问......
潜在语义分析采用自动的电脑方式来构建以高层次语义空间为形式的知识表征,是一种基于文本研究的有效方法.文章从三个方面描述了潜......
为实现文档在不同概念层次下的自动聚类,研究了潜在语义空间中维度的统计特性,发现对应大奇异值的维度描述了语义元素间的共性,对......
发现Web用户的访问模式是Web日志挖掘的重要任务之一。传统的Web用户会话聚类方法对解空间的搜索带有盲目性且缺乏语义特征,本文提......
近年来,非负矩阵分解模型已经成为数据挖掘领域中最成功的模型之一.该模型能够自动从一组高维向量中提取隐含模式,从而被广泛应用......
潜在语义分析在信息检索领域应用较多,但在近红外光谱领域应用较少。利用近红外漫反射光谱技术,结合潜在语义分析(LSA)和主成分分......
主题分割技术是快速并有效地对新闻故事节目进行检索和管理的基础。传统的基于隐马尔可夫模型(HiddenMarkov Model,HMM)的主题分割技......
软构件的检索方法一直是构件库研究的热点,而构件的合理分类是实现构件高效检索的基础。常用的基于刻面分类的构件描述方法,由于受......
针对基于VSM的文本特征空间中存在着大量同义词和关联词的不足,文章结合潜在语义分析和关联规则挖掘以减少信息冗余,改进分类效率。......
从网络文本自动分类的需求出发 ,针对基于VSM模型的分类处理中词条无关假设和词条维度过高等问题 ,对基于类中心向量的分类方法进......
中文摘录是一种实现中文自动文摘的便捷方法,它根据摘录规则选取若干个原文句子直接组成摘要。通过优化输入矩阵和关键句子选取算......
基于潜在语义分析和自组织特征映射神经网络(LSA—SOM),本文提出一种文本聚类方法。采用潜在语义分析的理论表示文本特征向量,以体现特......