【摘 要】
:
信息检索本质上是语义检索 ,而传统信息检索系统都是基于独立词索引 ,因此检索效果并不理想 .隐含语义索引是一种新型的信息检索模型 ,它通过奇异值分解 ,将词向量和文档向量
【机 构】
:
复旦大学计算机系,武汉大学计算机学院
【基金项目】
:
国家自然科学基金!资助项目“电子图书馆的相关关键技术”(6 99330 10 );国家863计划资助!项目“智能图书馆系统”(86 3-30 6 -ZT0 4-0
论文部分内容阅读
信息检索本质上是语义检索 ,而传统信息检索系统都是基于独立词索引 ,因此检索效果并不理想 .隐含语义索引是一种新型的信息检索模型 ,它通过奇异值分解 ,将词向量和文档向量投影到一个低维空间 ,消减了词和文档之间的语义模糊度 ,使得文档之间的语义关系更为明晰 .实验和理论结果证实了隐含语义索引能够取得更好的检索效果 .本文论述了隐含语义索引的理论基础 ,研究了隐含语义索引在中文文本处理中的应用 ,包括中文文本检索、中文文本分类和中文文本聚类等 .
其他文献
近年来,由于可再生能源利用与智能电网建设等的需要,电力储能技术作为一种新兴的调节手段,因其控制灵活、使用方便得到高度重视。储能技术通常可分为具有大容量储能特性、循
随着一卡通手机的出现,人们对手机支付的安全性的要求越来越高。由于人的指纹具有唯一性和不变性,所以利用指纹进行身份鉴别,将具有更高的安全性。本文从指纹识别技术出发,将
DEMATEL方法(决策试验与试验评估法)是一种运用图论与矩阵工具进行系统因素分析的方法。但此方法对系统因素间关系的评价仅限于实数域内,往往不适合描述现实生活中系统因素间
建筑风格是一个地区或民族传统文化的现实体现和传承载体。云南民族建筑的样式丰富多彩 ,各具特色 ,是云南民族文化多样性的直接体现。自然环境的多样性、民族文化的差异性和
"中国梦"的一大主题是"铭记历史";"铭记历史"是培养爱国之情的前提基础,当代大学生对中国近现代史知之不多和知之不深,凸显"铭记历史"的重要性;"中国梦"的"铭记历史"主题可分
<正>2008年3月13日,微软向企业级用户及开发人员正式发布了微软2008新一代企业级应用平台与开发技术:Windows Server 2008、Visual Studio 2008和SQL Server 2008。随着Windo
仿拟是英语广告中一种常见的修辞方式,它对消费者熟知的英语语言要素加以修改或演绎,衍生出新的内涵和形式,在让消费者迅速地领悟新的语言意境和美感的同时,达到对其进行劝购
为解决遵化市部分实生老栗树产量极低、存在部分低产栗园等问题,于2012年在遵化市马兰峪镇魏进河板栗园进行了低产板栗树高接换优试验。结果表明,通过改接燕山早丰、遵化短刺
<正>随着信息化的发展,网络时代已把我们带进了电子商务的世界。网络营销是以互联网为传播手段,通过对市场的互动营销传播,从而达到满足消费者需求和盈利目的的过程。电子商
建筑业目前仍是支持我国国民经济的支柱产业。商品住宅工程作为建筑市场的主流产品之一,其施工质量水平对社会的影响程度日益加大。本文总结分析了国内外建筑工程质量管控的