基于潜在语义空间的文本检索问题研究

来源 :情报科学 | 被引量 : 0次 | 上传用户:netrascal
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对潜在语义空间模型下文本检索存在的问题进行了研究;对LSI/SVD方法的理论及问题进行探讨,对文本一特征项矩阵加权方式进行了改进,对文本的聚类提出了k—means截尾算法,对原始向量空间降秩后的语义空间维数的确定提出了解决方法。
其他文献
一、适应“三贴近”要求,改进节目结构,扩大农村广播节目的影响力。近年来,奉新广播电视台在农村广播节目的结构设计上,首先加强和改进了新闻宣传,要求新闻节目板块化。对国际、国
在情报学史上,人们为了使情报学变成一门标准科学进行了不懈的努力.但无论是采用实证化路线还是定量化方法,或是采取价值中立态度都没有取得明显的成功.在多学科方法渗透到情
文章在分析目前科研院所信息服务平台现状的基础上,提出了面向服务的科研院所信息服务平台体系结构,为了解决该信息平台在服务重组、服务调用、数据共享等方面的技术问题,提出了
本文通过《新华文摘》2000-2004年的检索统计数据库的建设,从中分析《新华文摘》转摘文献和引用期刊的特点,并利用文献计量方法分析其摘引期刊及核心作者的分布规律,指出评价分
构筑大通道、疏通微循环,边疆走向世界,大山已无法阻挡。金秋十月,驾车远游,随宽阔纵横的高速公路在云岭群山里一路畅行……快捷的交通让人几乎淡忘了"横断山、路难行"的历史。
Library2.0是一种新技术,还是一种新理念,是近一年来图书馆界网络博客争论的热点,文中以Web技术的飞跃和图书馆精神的升华来阐释Library2.0的基本理念,并重点对Library2.0时代图书馆
如果说,了解节目主持人的角色定位和语言特点,是做一个合格节目主持人的必备条件,那么判断一个节目主持人成熟和成功的标志是什么呢?节目主持人的成功应是其自身作为传播者的个性
作为贯穿电视业广告销售、节目编排、节目制作各个环节的数据指标,收视率已成为检验节目的重要标准,这在一定程度上推进了电视媒体的市场化,对于实现电视业的精细管理无疑有较好
文章针对传统哼唱检索方案性能较低的问题,提出一种基于大页内存的哼唱检索系统改进方法,并选取n-gram模型搭建哼唱检索系统,分析大页内存技术对哼唱检索系统性能的改进效果,
2006,中国博客年“领导博”、“名人博”、“政府博”、“警察博”是经常见诸报端的热门话题。据中国互联网络信息中心(CNNIC)公布的《2006年中国博客调查报告》显示:截至2006年