基于PLSI的标签聚类研究

来源 :计算机应用研究 | 被引量 : 40次 | 上传用户:koalaz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有的大众分类中标签模糊导致影响用户搜索效率的问题,使用概率潜在语义索引(probabilistic latent semantic indexing,PLSI)模型对标签进行潜在语义分析,经回火期望最大化(tempered exception maximization,TEM)算法训练得到在潜在语义下的条件概率,生成概率向量;在此基础上,提出凝聚式层次k中心点(hierarchical agglomerative K-mediods,HAK-mediods)聚类算法对概率向量进行聚类,并进行了
其他文献
传统的欧氏距离不能鲁棒地度量含有相干斑噪声的SAR图像块之间的相似性。针对这一问题,将SAR图像的异质性测量方法与传统的欧氏距离结合,产生了一种新的SAR图像相似性测度,并在此基础上,提出了一种新的用于斑点噪声抑制的非局部平均滤波算法。该算法首先计算相似性窗口之间的欧氏距离和搜索窗口的变差系数;然后利用搜索窗口的变差系数自动调整退化参数h,并在欧氏距离和调整后的退化参数的基础上计算新的SAR图像相
提出一种用稀疏相似性度量求解压缩传感矩阵的方法,并将其应用在图像重建和识别领域中。首先构造一种稀疏相似性度量,然后将其嵌入到传感矩阵的模糊代价函数中,最终传感矩阵的原子更新按照模糊方式进行计算。用该方法优化后的观测矩阵与字典矩阵之间保持了低相干性,并且样本的稀疏信号在相同重构条件下具备了更优的测量数目和质量。在ORL和FERET人脸数据库及91幅自然图像库上的实验结果验证了该算法的有效性。
随着技术的发展和对安全性要求的提高,单一生物特征已经很难满足高度机密身份认证的需求,需要进行多特征身份认证,因此提出一种可以用做辅助认证的手形认证算法。该算法不限制图像采集背景,实验中采用了相对难处理的白色背景。先粗分割提取手形样本,后根据样本特征细分割得到手形轮廓,该分割算法能够在含阴影的图像中准确地提取手形轮廓,具有高自适应性和可移植性;同时提出了局部形状上下文手形认证算法,采用局部均匀采样,
标签推荐系统的推荐结果质量不高,会影响和误导用户对资源的查找与定位,甚至引发信息迷航的现象。为了提高推荐结果的准确度和覆盖度,提出的多阈连续条件随机场模型,不仅保持了条件随机场无须对数据作独立性假设且能避免标注偏执问题的优势,同时还使用标签间共现率、语义相似度和用户相似度三重阈提取特征,一并挖掘出显性和隐性标签,充分结合用户差异性,通过最大似然估计法迭代计算模型参数,建立模型来推荐标签。在BibS
为了实现双足机器人在障碍环境中的路径规划,提出一种将三维环境分层的方法,用两个截面将环境分为高于机器人身高障碍层、低于机器人抬脚高度障碍层和中间障碍层。首先在中间障碍层进行机器人轨迹规划,再根据机器人各种步态的不同损耗构建代价函数,把规划好的轨迹放到最底层进行规划修改,最终得到双足机器人在规划路径上代价最小的一系列连续的动作,通过计算机仿真实验验证了方法的有效性。
http://cloud.siat.ac.cn/ccgrid2015The 15th Annual IEEE/ACM International Symposium in Cluster,Cloud,and Grid Computing(CCGrid 2015)is a forum bringing together international researchers,developers,and
针对基本萤火虫优化算法在求解函数全局最优值时的不足,提出了一种带高斯变异的人工萤火虫优化算法。该算法在萤火虫的移动过程中,应用了高斯变异策略,从而在一定程度上避免了算法陷入局部最优,且能获得精度更高的解。通过对六个标准测试函数进行测试,结果表明,改进后的人工萤火虫算法比基本萤火虫优化算法有更高的收敛速度、求解精度和收敛成功率。
研究了一个制造商领导市场、一个零售商和一个第三方回收商共同负责回收且跟随决策的再制造闭环供应链系统。对制造商领导博弈时的四种不同市场结构下(M→R+T、M→R→T、M→T→
结合综合公交中各式公交的适应性和服务阈值,兼顾出行者不同出行目的时间价值敏感性,建立了综合公交系统线网布局双层优化模型,上层是0-1数学规划模型,下层是用户平衡分配模型。同时,基于改进的IOA进行优化求解,克服了传统单式线网优化层次化不显著的缺陷,提高了布局优化过程求解效率。算例仿真结果表明:综合公交系统需求多样性在客观上决定综合公交系统线网的多元性和层次性,线网布局优化需考虑不同出行目的的时间价
针对传统的概念格合并算法仅为单向的纵向或横向合并,提出一种基于概念内涵、外延升降序的双序渐进式合并算法。按照概念的内涵或外延的升序和降序,从两个方向(由上到下和由下到上)同时进行子概念格的纵向或横向合并。算法分析和示例结果表明,该算法不仅在结构上较好地保留了原有信息,而且在效率上也获得了显著的提高。