【摘 要】
:
针对短文本上以LDA为主的传统主题模型易受特征稀疏、噪声以及冗余影响的问题,首先梳理了文本特征表示法的变化以及短文本上主题模型的发展现状,并系统地总结了LDA模型和狄利
【基金项目】
:
国家自然科学基金(11771259)
论文部分内容阅读
针对短文本上以LDA为主的传统主题模型易受特征稀疏、噪声以及冗余影响的问题,首先梳理了文本特征表示法的变化以及短文本上主题模型的发展现状,并系统地总结了LDA模型和狄利克雷多项混合模型(DMM)各自的生成过程和相应的吉布斯采样参数推导。关于主题模型最优主题数,选取常见的4种优化指标进行了详细的对比说明。最后分析了近2年主题模型的扩展研究和其在网络舆情上的简单应用,并以此指明了未来主题模型的研究方向和侧重点。
其他文献
目的调查口腔综合治疗台水路(DUWLs)污染现状,探讨DUWLs污染的影响因素。方法采用分层随机抽样的方法,抽取2017年6月22日—2018年2月23日北京某口腔医院门诊各科室不同品牌的
回顾了信息构建的诞生和发展历程,并以万维网为背景介绍了信息构建的基本内容.在分析信息构建特点的基础上,作者从知识映射、认知检索和知识服务三个方面详细阐述了信息构建
陶喆的嗓音很迷人,很蓝色,让人听后觉得非常舒服的那种迷人声音,他的音乐很蓝色调,非常的西化。有这种音乐倾向的歌手并不多,如以前就出过英文歌的杜德伟及有类似风格概念的
过了三十岁的人,会有很多人小时候玩过"吹气球"的游戏。这里所说的气球,并非是五颜六色的气球,而是一种纯白色的气球。在那个玩具稀少的年代,小朋友们把白气球吹得长长的,大
传统淀粉-碘化镉法部分水解聚丙烯酰胺类聚合物浓度检测测试步骤繁琐,需要通风橱等大型设备,海上平台普遍不具备检测条件,只能采用"平台取样—船只运输—陆地化验"的测试模式
目的提高临床护理交接班质量。方法基于照护群集管理理念设计术后患者交接项目单,交接内容为3大项,即患者一般资料、术中情况、术后情况,用于术后患者的护理交接班中,并评价
编辑同志:2010年9月.我丈夫为做服装生意,在县城租赁了谢某的两间门面房。当时,双方在租赁合同上约定租赁期限是5年,每年租金35000元。2012年4月9日,丈夫在外出广东进货时遭遇车祸
普通程序简化审以不突破现有法律寻求合法性,且有利于司法资源的合理配置从整体上实现正义;同时由于建立在被告人认罪的基础上,仍不放弃实质正义的目标,遵守程序正义的原则,
新疆干旱半干旱的生态环境,造就了当地大量的生土建筑且各具地方特色,其中吐鲁番地区的生土民居作为当地人民世代相传的建筑形式,拥有着悠久的历史和深厚的文化内涵。文中从
互联网的快速发展,使得在线教育成为可能。在线教育能够突破时间和空间的限制,解决教育资源不公平的难题,帮助政府缓解新型职业农民培训的资金压力。与此同时,在线教育也存在