基于在线Biterm主题模型的少数民族新闻事件跟踪

来源 :云南大学 | 被引量 : 0次 | 上传用户:XU739603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着少数民族文化战略的深入推进和新媒体的不断发展,基于主题模型自动挖掘出有价值的少数民族新闻事件主题,实现新闻事件在线跟踪,是少数民族地区舆情监控、文化传播、政策制定等研究和应用的重要基础。近年来,围绕少数民族新闻获取、分析与利用的研究不断增多,但现有研究大多属于理论思辨研究或典型个案解析,缺乏对少数民族新闻事件特点的深入挖掘。因此,本文针对少数民族新闻的稀疏性、敏感性、易演化性和次生性等特点,基于在线Biterm主题模型(Online Biterm Topic Model),通过随机坍缩变分贝叶斯(Stochastic Collapsed Variational Bayesian Inference,SCVB0)算法更新参数,提出面向少数民族新闻事件跟踪的主题模型MBTM(Minority Biterm Topic Model),利用该模型检测初期事件主题、跟踪后续新闻所属的主题。为了对存在关联关系的少数民族新闻事件进行串联,本文提出事件线索的概念,分别从主题层面和语义层面度量线索关联度,进而针对新闻事件主题生成事件线索。具体而言,本文的主要研究内容概括如下:(1)针对少数民族新闻数据的稀疏性和敏感性,本文提出了面向少数民族新闻事件跟踪的在线主题模型MBTM,给出了模型的基本定义和构建方法,进而提出基于SCVB0算法的主题模型参数更新方法。(2)针对少数民族新闻的易演化性和次生性,提出了基于MBTM主题模型的少数民族新闻事件跟踪方法,并引入事件线索对新闻事件进行抽象描述。(3)为了测试本文模型和方法的有效性和可行性,使用不同媒体平台的少数民族新闻事件数据集对模型构建、主题检测、事件跟踪和线索生成结果进行实验测试,实验验证了模型和方法的有效性和高效性。(4)从应用角度,基于本文提出的模型和方法,设计并实现了少数民族新闻事件跟踪系统,方便用户快速直观的把握少数民族新闻事件的全貌,并获取事件信息摘要。
其他文献
目的:研究自拟方镇逆反流汤治疗吸入性肺炎脾胃虚寒、痰浊气逆犯肺证患者的临床疗效及对白细胞计数、中性粒细胞百分比、C反应蛋白、肺部感染评分(CPIS)的影响,评价镇逆反流汤的临床疗效。方法:从2020年12月至2022年1月在广西中医药大学附属瑞康医院呼吸内科住院部及康复科住院部治疗的吸入性肺炎患者中筛选出符合标准的72例患者,按随机数字表法随机分为治疗组和对照组,对照组予常规西医方案治疗,治疗组在
学位
行星际闪烁(interplanetary scintillation,IPS)是指宇宙中的射电源所发出的射电信号在经过太阳系的行星际空间时,因受到太阳风的影响,造成的射电信号的相位和幅度发生波动的情况,因此对IPS进行监测,以此来预测太阳风的动向,可以有效减少空间天气带来的危害。我国的射电天文重要观测与研究平台——云南省天文台40m射电望远镜,在进行射电天文定标操作时,其后端控制系统的操作程序较为
学位
十八大以来,明确提出要严抓领导干部的权力运行和履职尽责,全面从严治党迈入新的台阶,同时也将生态文明建设纳入了“五位一体”总体布局中。随着审计全覆盖的提出,审计工作所覆盖的范围更加广泛。加强对领导干部的管理与生态环境的优化治理是党和国家重点关注的领域。这也为经济责任审计与自然资源资产离任审计提出了更高的要求。但与此同时,审计供给与需求并不匹配,审计任务负担重但审计效率难以提升。研究经济责任审计与自然
学位
目的 探讨三氧大自血疗法结合循证护理对急性脑梗死患者的治疗效果及对预后的影响。方法 选取急性脑梗死患者115例为研究对象,按随机数字表法和患者个人意愿分为实验组和对照组。失访8例,最终实验组纳入49例,对照组58例。对照组给予常规治疗和护理;实验组在对照组基础上,给予三氧大自血疗法和循证护理。比较2组患者临床疗效和治疗前后收缩压(SBP)、舒张压(DBP)及心率。使用美国国立卫生研究院卒中量表(N
期刊
同时或准同时多谱线太阳成像观测可以获得太阳大气三维磁场和热力学参数,是未来太阳观测焦面终端设备的重点发展方向。傅里叶光谱仪具有宽波段、高灵敏度、高光谱分辨率的优势,但因受限于高帧频、大面阵探测器制约,尚未用于太阳光谱成像常规观测。随着CMOS图像传感器技术迅猛发展,在可见光和近红外波段,探测器面阵大小和帧频相比传统CCD探测器有了质的提升,使得面阵傅里叶太阳光谱仪研制成为可能。通过引入高帧频面阵C
期刊
目的:观察子午流注泻初补正纳支法治疗心肾不交型失眠症的临床疗效,对睡眠质量及生活质量的影响及评价安全性。方法:60例心肾不交型失眠患者随机分成针刺组、药物组2组,各组30例;治疗组应用子午流注泻初补正纳支法,于肾经当值的酉时正刻(南宁地方时18:48-19:47)补本经母穴复溜穴及补照海穴,配泻心经通里穴,每天1次,连续治疗6天,休息1天后继续,疗程13天;西药组给予艾司唑仑片,睡前半小时口服1m
学位
文本挖掘是通过对文本数据进行分类和关键词提取,来挖掘文本中重要信息的一种技术。现有的基于神经网络模型的文本挖掘方法都是面向平衡数据的,而忽略了不平衡数据的情况,这会造成模型在训练过程中过多的关注占比较大的数据,忽略占比较少的数据。为了解决数据分布不平衡带来的问题,本文采用了随机采样、模型集成等多种方法来提升深度模型在文本挖掘任务上的性能。首先针对文本分类任务提出了一种基于预训练语言模型的加权集成方
学位
目的:通过建立慢性阻塞性肺疾病(COPD)大鼠模型,从p38MAPK通路探讨清肺化痰汤干预COPD的炎症机制研究,进一步探讨清肺化痰汤对COPD的疗效机制。方法:选取60只健康SPF级Wistar大鼠,雄性,体重(200±20)g,按随机数字表法随机分成6组,正常组(A组,n=10),模型组(B组,n=10),清肺化痰汤低剂量组(C组,n=10),清肺化痰汤中剂量组(D组,n=10),清肺化痰汤高
学位
目的:本实验旨在通过气管内注入脂多糖(LPS)联合烟熏复合方法,复制慢性阻塞性肺疾病(COPD)大鼠模型,采用ELISA、RT-PCR方法检测COPD模型大鼠血清、支气管肺泡灌洗液(BALF)中IL-8、IL-17、IL-10含量及肺组织中MUC5AC m RNA表达水平,观察清肺化痰汤干预后COPD模型大鼠血清、BALF中IL-8、IL-17、IL-10含量及肺组织中MUC5AC m RNA表达
学位
目的:通过观察针刺肺俞配定喘、孔最配鱼际对哮喘大鼠的气道阻力(RL)和肺顺应性(Cdyn)的影响,肺组织气道形态学及病理学的改变,肺组织TGF-β1、Smad3 m RNA和蛋白表达的变化,从分子水平揭示针刺抗哮喘气道重塑的疗效机制,为针灸治疗哮喘提供科学依据。方法:随机将50只SPF级雄性SD大鼠分为正常(NC)组、模型(AS)组、针刺肺俞配定喘(AAF)组、针刺孔最配鱼际(AAK)组、假针刺(
学位