潜在语义分析中主题数的确定方法

来源 :信息技术 | 被引量 : 0次 | 上传用户:bigboss555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
潜在语义分析的主要思想是通过奇异矩阵分解的方法将高维向量空间模型表示的文档映射到低维的潜在语义空间。在采用潜在语义分析对自然语言文档进行分类的过程中,一个关键的问题是如何确定主题数。通常的做法是在降维过程中缩减保留奇异值数目,使得保留的奇异值的平方和达到所有奇异值平方和的90%。此保留奇异值的数目即主题数,但这种方式并不够准确有效。为能够更加准确地确定主题数,文中提出了另一种自动确定主题数的有效方法。测试结果表明,该方法能够自动有效确定主题数。
其他文献
本文根据实际生产数据,运用数理统计方法,分析了炭素铬铁中碳、硅、硫的存在形态及三者的相互关系,指出了影响炭素铬铁碳、硅、硫含量的各种因素及其控制方法。
为了改善75%硅铁的技术经济指标,提高产品质量,降低产品铝含量及电耗,国内确的厂家在炉料中添加CaCl_2进行了这方面的试验,并取得了成功的经验。鉴于CaCl_2价格比较贵,为了寻
期刊
港口建设发展过程中可能会出现大气环境质量现状超标,这种现象在北方港口尤为突出,大气环境质量现状超标则意味着港口的发展受到了大气环境容量的制约,那么该如何解决这个问
<正> 一、前言硅铁是用带埋弧电极的电弧炉生产的。混合物炉料主要由硅石、铁屑和作为还原剂的焦炭组成。反应产物为硅铁、一氧化碳、其他各种挥发物质、水蒸气和一氧化硅气
摘 要:合格零件的加工前提是需有合理的加工工艺,工艺制定得合理与否,对程序的编制、机床的加工效率和零件的加工精度都有重要影响。但很多数控机床操作者会误跌一些工艺陷阱。本文以典型轴套类零件为例,详细剖析其数控车削工艺的特殊“奥秘”,确定合理的加工方案。  关键词:数控 工艺陷阱 零件  中图分类号:TG5 文献标识码:A 文章编号:1672-3791(2013)07(b)-0109-02  在数控机
为了可以更好地处理人脸识别中数据量大、高维度、非线性等问题,文中提出了一种 基于压缩感知的人脸识别算法.首先采用随机测量矩阵将人脸稀疏表示,其次使用主成分分析 法对
目前增压技术已经广泛应用于现代船舶柴油机,以实现提高柴油机单缸功率的目的,而喘振是船舶柴油机增压器的常见故障之一。针对一起ABB TPS.57-D型废气涡轮增压器喘振故障现象,结
传统艺术设计专业教学方法已经不能满足学生对知识的需求,因此计算机被引入了教学课堂,用以辅助教学。计算机在图形设计方面具有很强的功能,它能够动态显示所设计出的各种图
针对智能家居系统发展中出现的智能安防的需求,文中基于位置服务(LBS)研究并实现了一套智能家居系统,通过各种硬件互联,实现了括门禁控制、远程监控、移动物体定位、异常环境监
以植物乳杆菌(Lactobacillus plantarum)CD101和模仿葡萄球菌(Staphylococcus simulans)NJ201作为混合发酵剂制作发酵香肠,以自然发酵为对照。通过测定理化指标、十二烷基硫