【摘 要】
:
针对基于传统LDA主题模型的标签生成算法对用户兴趣主题描述不完整的问题,提出一种基于主题嵌入表示的微博用户标签生成算法TopicERP.该算法在LDA模型的基础上,通过引入Word2vec词嵌入模型,对用户兴趣主题进行全面描述,并对匹配度计算方法进行改进.首先利用LDA主题模型对用户微博进行主题分析,生成用户兴趣主题;然后利用Word2vec词嵌入模型将主题文本转换为主题向量,用于匹配度计算;最后,利用余弦相似度和主题在文档中的条件概率,计算主题向量与候选标签匹配度,选取Top-Q的候选标签作为目标用户标
【机 构】
:
江苏科技大学计算机学院,江苏 镇江 212100
论文部分内容阅读
针对基于传统LDA主题模型的标签生成算法对用户兴趣主题描述不完整的问题,提出一种基于主题嵌入表示的微博用户标签生成算法TopicERP.该算法在LDA模型的基础上,通过引入Word2vec词嵌入模型,对用户兴趣主题进行全面描述,并对匹配度计算方法进行改进.首先利用LDA主题模型对用户微博进行主题分析,生成用户兴趣主题;然后利用Word2vec词嵌入模型将主题文本转换为主题向量,用于匹配度计算;最后,利用余弦相似度和主题在文档中的条件概率,计算主题向量与候选标签匹配度,选取Top-Q的候选标签作为目标用户标签.本文在公开微博数据集microPCU上进行实验,实验结果表明,该算法在总体性能上高于基于传统LDA主题模型的微博标签生成算法,生成的用户标签能够较为准确地描述用户的兴趣偏好.
其他文献
复合材料的高效加工一直备受关注,尤其是大型复合材料结构件的加工.针对大型复合材料结构件的多孔系加工过程中出现的翻边、毛刺、加工效率低的问题,通过对机床主轴单元系统改造,重新设计内冷主轴单元、优化切削参数,重新设计切削刀具等方法,在工件表面孔间距过小、龙门结构刚性差的情况下,彻底解决了加工过程中切屑瘤现象严重,孔口倒角刮擦、翻边严重等问题,并大大提升了该大型工件钻孔的效率和质量,在节约生产成本的同时也为其它大型复合材料结构件的加工提供了借鉴方案.
介绍应用于起重机卷扬系统马达变量模块的变量原理和抖动机理,基于整机测试数据分析和Amesim软件对马达变量动态特性进行仿真研究,提出采用压力切断阀阀芯正遮盖对马达变量模块进行优化设计,提升马达变量平稳性,解决卷扬抖动故障.
在现代化施工领域,机械设备的普及率越来越高,一个工程中使用的设备数量占据很大比例.但是企业原有的设备管理系统仅能用来做报表使用,而且数据存储依赖于数据中心,无法满足更多的管理需求.区块链技术针对以上问题均有有效的解决方案.例如在设备采购和租赁、合同签订、日常使用、维修保养、结算、报废处理等.并且对区块链技术可以应用的场景进行详细描述.
离双向液压锁是混凝土泵车支腿液压系统的关键零部件,其功能是在系统停止供油时,将支腿垂直液压油缸的有杆腔和无杆腔锁住,使支腿垂直液压油缸能在其行程范围内任意位置长时间停留.本文通过对返厂故障双向液压锁测试,根据测试结果,分析了故障原因,提出了改进措施,为双向液压锁结构设计及优化提供参考.
某型挖掘机市场反馈消音器支架开裂故障较多,平均故障时间800h左右,市场隐患比较大,本文通过借助结构应力分析和模态分析对支架进行设计优化,大大提高使用寿命,实现预期目标.
某针对市场反馈机械式推土机出现打滑、齿轮异响、结合不良等问题,本文通过主离合器及惯性机构工作原理、机器运转过程中的检查、主离合器及惯性机构的调整方法的介绍,为排除相关故障,提供有力的技术支持.
卷积神经网络在计算机视觉等多个领域应用广泛,然而其模型参数量众多、计算开销庞大,导致许多边缘设备无法满足其存储与计算资源要求.针对其边缘部署困难,提出使用迁移学习策略改进基于BN层缩放因子通道剪枝方法的稀疏化过程.本文对比不同层级迁移方案对稀疏化效果与通道剪枝选取容限的影响;并基于网络结构搜索观点设计实验,探究其精度保持极限与迭代结构的收敛性.实验结果表明,对比原模型,采用迁移学习的通道剪枝算法,在精度损失不超过0.10的前提下,参数量减少89.1%,模型存储大小压缩89.3%;对比原剪枝方法,将剪枝阈值
为确保导航卫星星间链路的正常运行和服务效果,星间链路运行服务质量评估成为星间链路领域研究的一大热点.本文构建以OSI参考模型为依据的星间链路运行服务评价体系,依据不同的网络层次对底层指标进行划分,从物理层、链路层、网络层、传输层和应用层多角度、多层次对导航卫星星间链路运行服务进行评价;依据模糊数学理论得到各个评价因素的权重以及隶属度,用以计算出星间链路网络的模糊综合评价值;利用导航卫星星间链路仿真数据,依据建立的评价指标体系以及采用的模糊评估方法,计算出导航卫星星间链路运行服务的仿真数据的模糊评价得分.本
柔性作业车间调度问题具有解集多样化与解空间复杂的特点,传统多目标优化算法求解时容易陷入局部最优且丢失解的多样性.在建立以最大完工时间、最大能耗、机器总负荷为优化目标的柔性作业车间调度模型的情况下,提出一种改进的非支配排序遗传算法(Improved Non-dominated Sorting Genetic AlgorithmⅡ,INSGA-II)求解该模型.INSGA-II算法先将随机式初始化与启发式初始化方法混合,提高种群多样性;然后对工序部分与机器部分采用针对性的交叉、变异策略,提高算法全局搜索能力;
人工神经网络(ANN)已被应用于获取布里渊光时域分析仪(BOTDA)所测的布里渊频移信息(BFS),然而其存在易陷入局部最优和收敛速度慢等缺点.为了克服上述缺点,本文提出一种基于WOA优化人工神经网络(WOA-NN)快速获取布里渊光纤传感器BFS的方法;随后通过设计非线性收敛因子a,进一步构建基于非线性WOA优化的神经网络(NWOA-NN)用来提取BFS.将提出的2种网络与经典ANN、粒子群优化神经网络(PSO-NN)、遗传算法优化神经网络(GA-NN)等模型进行比较,实验结果表明,本文所提出的WOA-N