基于在线层次化非负矩阵分解的文本流主题检测

来源 :浙江大学学报:工学版 | 被引量 : 0次 | 上传用户:fudxing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对文本流主题检测中存在的主题结构扁平问题,提出在线的层次化非负矩阵分解方法,在每个时间片中根据归一化累计折损增益选择主题节点进行分解,接着反复将文档分配给最相关的主题节点构建主题层次,该过程中假设主题在由不同时间片中相似主题节点构成的序列中连续再演化,在当前时间片对主题节点进行分解时考虑过去时间片中主题节点的分解结果.该方法不仅能在线的发现和更新文本流中的主题,而且还可揭示主题间的结构关系.在Nist TDT2数据集上的实验结果表明,该方法在NMI、Micro F1、MAP和NDCG等指标下均显著超过了
其他文献
为了深化效应的理论认识,建立圆隧围岩应力松弛效应理论模型,采用经典应力松弛模型计算围岩三维应力场,探讨应力松弛模型及其流变参数的敏感性.结果表明:采用Burgers模型与西
试验在pH10.0~11.0条件下,用络天青S(CAS)和溴化十六烷基吡啶(CPB),Tritonx-100与铍形成橙色四元络合物,其最大吸收波长为508nm,采用洒石酸,柠檬酸钠,EDTA,三乙醇胺等作为掩蔽剂,可消除多种共存离子的干扰直接测定多金属矿中微量
为了更加科学有效地评价砂型铸造生产过程碳排放量与生产效率的问题,在分析砂型铸造过程碳排放的基础上,提出砂型铸造生产过程的碳效率模型和评价方法,使企业有针对性地开展
针对市政系统和水利系统中设计暴雨重现期不一致的情况,提出基于年多个样法和年最大值法的次风险理念和年风险理念.指出市政系统重现期所表征的风险除特大值外还包括次大值等
针对泥沙数学模型作为预报河床冲淤的研究手段在进一步发展中受到有关物理参数的限制,分析河口泥沙数学模型涉及的若干关键问题.从三维微分方程竖向积分角度分析认为恢复饱和
利用带有积分球的SHIMADZU UV—240分光光度计,测量了组织在固定前和后的反射率和透射率,分析了福尔马林固定对组织光学性质的影响。
通过破坏性试验和冲淤水槽试验,对四面六边透水框架防护措施的稳定性进行研究.破坏性试验研究防护层破坏发展过程和破坏临界条件下来流摩阻流速与防护层参数之间的关系,冲淤
根据Lǒwdin提出,在DNA分子中,碱基对之间的氢键体系X—H…y中存在一个对称的双势阱。本文研究了DNA分子受He-Ne激光影响后,使质子在双势阱小的隧道效应极大增加,从而引起了
针对层状复合管道经典半解析有限元(SAFE)模型无法直接区分纵向模态导波和扭转模态导波的问题,在SAFE基本原理基础上结合纵向模态导波和扭转模态导波的力学特性,分别建立纵向模
本文较系统地报道了CO_2激光,He-Ne激光的生物学作用,证明激光确能导致生物体内生理生化的变化,确能诱发染色体畸变和基因突变。作者认为激光作为育种上一种新的诱变因素是有