基于共轭分布和参数估计算法的文本大数据主题分析应用综述

来源 :内蒙古师范大学学报(自然科学汉文版) | 被引量 : 0次 | 上传用户:asdf303
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着文本规模和种类不断增加,主题模型作为一种主要的文本主题分析工具也在不断演化,传统的基于概率统计的主题模型逐渐向基于神经网络的主题模型转变.对近年来不断更新的主题模型算法,从主题模型的三个改进方面增加外部辅助信息、改进参数分布的共轭先验、改进采样过程进行阐述,旨在令读者能够快速了解文本主题分析中存在的问题以及近年来主要的主题模型改进方法.在主题模型中,共轭分布和参数估计算法都是重要的数学理论,对两者在模型改进中的重要地位进行阐述.最后,对主题模型的改进方向进行总结和展望.
其他文献
廖山涛是我国杰出的数学家,在拓扑学特别是动力系统领域的研究中取得了极为突出的成就,是中国微分动力系统的奠基人与开拓者.通过钩沉史料、实地调研与开展访谈,考证并复原了廖山涛1956年回国到北京大学数学力学系任教之前的若干生平事迹,简要评述了这一时期廖山涛在拓扑学领域的学术贡献.
摘要:短视频作为当下兴起的一种重要视频样式,在弥补缺失化社交、形成沉浸式体验、促进回馈式流量等方面具有不可忽视的传播价值,为走出“同温层”,进而打破“信息茧房”提供了新途径,也为用户构建了虚拟空间下的狂欢广场。同时,短视频的内容品性随着这一样式的普及化逐步定型,人格化表达和聚焦化呈现成为当下短视频的突出特质。本文将从叙事品性、传播心理和模式突破层面出发,以其相关理论为依据,阐述短视频这一视频样式的
中国故事是中华民族几千年来勤劳顽强、奋勇拼搏形成的关于中国人共同情感与奋斗的经历,讲好中国故事是中国社会向世界展示中国形象和中国话语权的一个重要手段.高校思想政治理论课是落实立德树人根本任务的关键课程,在讲好中国故事的素材选择上,不仅要深挖汲取中华优秀传统文化故事,而且要用典型事例和伟大成就来讲述疫情防控中感人的中国故事,更重要的是要客观真实地阐述中国共产党建党百年的中国红色故事,通过经典中国故事的感染力厚植青年大学生的爱国之情、砥砺青年大学生的爱国之志.
在原始文献和相关研究文献的基础上,遵循“为什么数学”的研究范式,探究笛卡尔与费马创立解析几何的思想路径,重点比较二人在思想与方法上的异同,同时探究其思想方法对于当前倡导的学科核心素养理念下解析几何教学的启示与借鉴,揭示数学史对于数学教育的意义.
在大数据背景下,海量数据资源已快速渗透到许多领域,数据量激增,数据形态多变,迫切需要具备较强数据分析能力的统计学专业人才.因此为了对大学生统计数据分析能力有更多认识,从大数据背景下统计学专业学生数据分析能力培养的必要性出发,探讨了数据分析能力的内涵和构成,以及培养统计学专业学生数据分析能力的新要求,最后给出了当下对统计学专业学生数据分析能力培养的若干建议.
摘要:数据新闻以全新的新闻表现形态改变了受众对新闻的感知和理解方式。但由于数据新闻受众认知基础薄弱,受众数量积累困难,故而造成其舆论影响效果和社会传播功能受限,研究数据新闻受众的采用行为及其影响因素就显得十分重要。本文以受众采用数据新闻的影响因素为实证研究对象,基于UTAUT理论模型和文献分析设计调查问卷,通过数据分析发現:绩效期望、性能预期、个体创新性和社会因素正向影响受众的采用意愿;同时根据实
课程思政是高校育人的一个系统性项目,地方本科高校课程思政育人是实现“立德树人”重要环节.在地方本科高校诸多专业中,汉语言文学专业是思政专业以外最具丰富的思政育人内容专业,汉语言文学专业在思政育人内容上具有一定的优势.就汉语言文学专业在课程思政育人方面,地方高校可以通过抓好教材开发体系、专业师资与思政师资共享、“体感”并用教学法和全方位协作育人等四个向度来持续推进课程思政育人工作.
当全新的信息传播技术和数据成为所有类型媒体标配的时候,新媒体平台也开始拥抱那些早已经不再传统的“传统媒体”,并以市场思维聚拢受众、以优质内容俘获受众、以个性关怀留住受众,从而找到了破圈的全新可能性.由商业视频平台B站出品的流浪动物救助情感类真人秀节目《百分之二的爱》就是一个典型代表.B站是一个紧紧围绕用户、创作者和内容而构建起来的以视频为主要形态的优质内容生态系统.在B站社区中,形成了关爱各种动物、宠物的亚文化社区,《百分之二的爱》就是在这样的语境下诞生的.节目由全网流量明星和B站流量UP主担任固定成员,
期刊
在“人工智能+教育”的教学背景下,针对学生程序设计类作业的反馈工作,提出了一种基于程序依赖图(PDG)的程序代码分类方法.该方法将一组学生程序代码按照求解思路进行自动分类,为教师后续形成有针对性的反馈提供帮助.包括三个关键步骤:首先采用静态分析技术,将源代码生成PDG;然后采用一种基于结构特征的向量表示,将程序表达为特征向量;最后通过k-means聚类算法对一组PDG进行分类.实验对38个求解同一编程问题但实现算法有差异的程序代码开展研究,结果表明了该方法的有效性.
泽田吾一是日本著名数学家,编纂的数学教科书中有6部在晚清被翻译成中文引介到中国.通过对其中中学数学教科书的介绍,认为它们已经具有现代中学教科书的特点,对当时中国数学教育近代化起到了直接的促进作用.