潜在语义分析理论及其在文本检索与聚类中的应用研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:mdtuyen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
潜在语义分析(Latent Semantic Analysis,LSA)是一种自然语言信息提取和再现的理论方法,它的原理是通过对大量的文本集进行统计分析,从中提取出词语的上下文含义。它同向量空间模型类型类似,采用空间向量表示词汇和文本,并进行SVD分解,论文叙述了潜在语义分析的基本理论方法,然后通过实例说明LSA在信息检索中的应用,并通过分析结果中文本间、词汇间的相似度的变来说明LSA在信息分类中的重要意义。 本文对潜在语义分析模型进行了系统的研究,包括奇异值分解,通过数学中的奇异值分解来分析文本集中各个词汇之间,各个文本之间,文本与提问式之间的关系,同时本文研究和探讨了潜在语义分析模型在文本聚类中的具体应用和实现,包括文本间和词汇间的相似度的度量。 本文对采用潜在语义分析模型的聚类效果进行了相应的研究分析,给出了聚类操作方法和试验结果,以及对实验结果的具体分析。
其他文献
每个少女,都有一只朴素的或精致的箱子.她们的梦,有些甚至是一生的梦,都锁在这个小小的箱子里.很多时候,男人不知道女人的箱子里藏了些什么东西,他们大致可以猜到,无非是些衣
[英国《卫报》网站12月9日报道]题:研究显示,山区缺水导致19亿人面临风险(记者 乔纳森·沃茨)rn一项国际研究显示,随着全球变暖和需求增加导致山岳冰川、积雪和高山湖泊减少,
期刊
“五字教学法”是指读、讲、疑、练、评五种方法。政治课教学中运用“五字教学法”,可以使学生处于动脑、动眼、动口、动手的积极学习状态中,进而提高学生的学习兴趣和学习效
黔阳冰糖脐橙是从普通冰糖橙芽变选育的冰糖橙新品种.果实圆球形,纵径75.6 mm,横径72.0 mm,果形指数1.05,单果质量192 g,果皮厚5.1 mm,果面橙色且较光滑,果脐闭合.果肉黄色,
清明回家挂亲,挂完亲后有两天时间,很想见见一些老朋友.昭龙是我最想见的.他是我小学到高中的同学,他没考上大学,就留在农村.我读大学和刚参加工作的那段时间,常到他家去玩.
本文阐述了文献资源发展政策的涵义,概述了国内外图书馆文献资源发展政策的研究动态,对文献资源发展政策的定义、内容范围、研究意义及制定政策的依据和程序做了介绍,同时探讨了
时至今日,WWW网承载了数以亿万计的网页信息资源,如何对其进行有效的开发利用,为用户提供个性化的信息服务,不仅仅是图书情报领域的专家需要考虑的课题。图书馆员在上个世纪
计算机及互联网在金融业的运用改变了传统业务的处理手段和程序,存、贷、取、汇、证券买卖、市场分析、行情预测以及机构的内部管理等,均通过计算机处理。电子化资金转移系统
从早期的罗大佑、崔健、黄磊,到如今的周云蓬、钟立风、万晓利、吴虹飞,这些唱歌的人,都有一个特殊的身份:作家、诗人。乐评人李皖扫描了当下乐坛这些有着文学初衷的歌唱者。
符老其实并不算很老,才五十几岁,身板子硬朗,经常打赤膊;对人和善,一扯到他感兴趣的话题,就滔滔不绝,常有妙语出现.那天在枇杷树下,他叭叭猛抽了两口烟,扔掉烟头,对我说,小蔡