基于LDA主题模型的形势与政策教育创新实践

来源 :西部学刊 | 被引量 : 0次 | 上传用户:dsgver454g
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:LDA 主题模型(Latent Dirichlet Allocation)是一种非监督机器学习技术,可以用来识别大规模文档集 或语料库中潜藏的主题信息。选取“中国政府网”下“新闻”栏目中 2020 年的相关新闻报道为数据来源。通过对 12 个月 35 个主题进行统计分析,识别出常规型主题、周期型主题和节点型主题,对大学生进行形势和政策 创新教育实践,结果表明:LDA 主题模型展现了在数据降维和整合信息方面的良好效果,学生在教育过程中实现 了深度参与,从知识的被动接受者变为知识的生产传播者,产生了学习主人翁意识,关心时事和政策的积极性得 到显著提升。
  关键词:形势与政策教育;研究型学习;LDA;主题模型
  一、形势与政策教育面临新变化
  近年,尤其是疫情发生以来,以 BBC 为代表的西方 媒体不断用有色眼镜看待中国在疫情防控、经济发展等 方面取得的伟大成就,不仅无视其本国政府在疫情防控 中的毫无作为,反而通过诱导性的采访和带有“滤镜” 的失真报道在国际社会中歪曲和诋毁中国形象。同时, 国内一些人则与国外媒体一唱一和,全然不顾我国各项 工作取得的成绩,在互联网媒体上散播不实言论,试图扰 乱视听。因此,对当代大学生开展形势与政策教育,帮助 他们去伪存真摆脱干扰,准确理解党和国家制定的各项 政策,从而坚定“四个自信”①,真正成长为社会主义建 设者和接班人,为实现中华民族伟大复兴的中国梦而努 力奋斗是十分必要的。
  在目前开展的形势与政策教育中,无论是课堂教学 还是日常教育,主要还是依靠教师讲授、学生听课为主的 方式。這种方式相对简单、易于操作,但忽视了发挥学生 在受教育过程中的主观能动性,不能很好地调动学生的 学习积极性。形势与政策教育具有很强的学科交叉属 性,涵盖了多个领域并且需要对多学科进行高度融合,需 要我们充分利用学生的求知欲和参与其中展示自我的渴 望,积极引导其开展研究型学习,主动挖掘形势与政策现 象背后的起因和逻辑。因此,合理选择便于开展研究型 学习的工具对于提高学生学习的积极性、实现教育过程 中学生的深度参与是十分关键的。
  科学技术尤其是新媒体技术的发展,催生了大量以 新闻信息生产、加工和搬运为主的自媒体,他们和主流新 闻媒体一起,为人们随时随地获取多样化的新闻信息提 供了便利。但应当注意到的是,这片浩瀚繁杂的新闻信 息海洋是鱼龙混杂、良莠不齐的,一部分未经证实和审核的新闻也借助自媒体或被动或主动地进入了公众的视野,极易借助互联网的力量形成网络舆论;而近年来发生 的资本控制舆论的现象也扰乱了正常的新闻秩序,干扰 视听。面对海量的新闻信息,即使是专业的新闻工作者 也难以做到阅读并归纳每一条新闻,更不用说以学业为 主的当代大学生了。因此,寻找到适合于作为形势与政 策教育的新闻信息来源,和能够较好地对新闻信息进行 降维整理的工具,对于准确而高效地开展大学生形势与 政策教育是十分有益的。
  二、LDA 主题模型基本原理和数据来源
  LDA 主题模型(Latent Dirichlet Allocation)是一种 非监督机器学习技术,可以用来识别大规模文档集或语 料库中潜藏的主题信息。它是一种包含词、主题和文档 三层结构的三层贝叶斯概率模型,并基于以下过程来生 成一篇文档:首先以一定的概率分布(实际为多项式分 布)选择一个主题,再以一定的概率分布(实际为多项 式分布)选择一个词,重复上述过程即得到一篇文档,因 此也被称作文档主题生成模型 [1]。
  LDA 主题模型作为一种自然语言处理模型,借助计 算机的强大运算能力来处理文本信息,克服了人工阅读 能力的限制,使我们可以建立起较为丰富的新闻信息文 本数据库;同时 LDA 提出了主题这一概念,通过建立主 题和文档之间的概率分布实现对文档的降维 [2],通过建 立主题和词之间的概率分布实现对词的基于词义的聚类 整理,为我们基于海量的新闻信息开展形势与政策教育 提供了抓手;该模型被广泛应用于数据挖掘、图书情报、 文本检索等相关领域且取得了较好的应用结果,是一种 较为成熟的科学研究工具,比较适合学生主动参与开展 研究型学习。
  本文选取“中国政府网”下“新闻”栏目中 2020年的相关新闻报道为数据来源。选取依据是:“中国政府 网”作为我国政府唯一官方网站,其内容的权威性不容 置疑;选择在年末对即将过去的一年及时进行总结和回 顾,便于结合时事开展形势与政策教育,突出时效性;“中 国政府网”所刊登的新闻报道是经过认真审查酌定的, 本身就已经是“过滤了的”高质量新闻信息文本数据源, 非常适合在此基础上开展基于 LDA 主题模型的分析与 研讨,从而更好地理解和把握国家的形势与政策。
  三、教学实践实施安排及结果分析
  (一)教学实践实施安排
  首先,对“中国政府网”下“新闻”栏目中 2020 年 的相关新闻报道进行网络文本抓取,按月份储存构建文 本数据库,再进行分词和数据清洗构建语料库。其次,将 所带班级学生分为 12 个学习小组对应每一个月,每个小 组选择合适的主题数目和迭代次数对各自月份的语料库 进行 LDA 主题建模,完成文本数据计算。采用聚类、迷 惑度等指标进行多次测试。本研究的主题数目设定为 35 个,迭代次数设定为 1000 次。最后将 12 个月的结果 进行串联汇总,结合文本数据库进行分析说明,阐释结果 背后的形势与政策,形成年度总结。
  (二)结果分析
  通过对 12 个月各自输出的 35 个主题进行统计分析, 发现所有能够清晰识别的主题可以分为三类:在每个月的 主题统计结果中均出现的常规型主题、在固定月份出现的 周期型主题和由临时发生的事件引发的节点型主题。
  1. 年度新闻中的常规型主题 常规型主题是对国家长期坚持的路线、方针、政策的反映,为大学生做到时刻与党中央保持一致指明了方向。 指明并分析这类主题,对于引导大学生正确的时政方向、 端正奋斗目标具有重要作用。通过对主题数据进行梳理, 共得到 10 个常规型主题,分别是:国际合作、教育、经济、 就业、民生、农业、投资建设、脱贫攻坚、疫情、政府服务。 本文选取疫情这一主题,对 LDA 主题模型分析结果进行 展示。   由于各学期的教学重点设计不同,课时分配及教师布置的任务侧重点也可随之改变。例如,第一学期重点为扩大词汇、强化听说技能训练、培养学生学习英语的兴趣。可以在自主学习任务中相应增加英语构词法、词根词缀等内容的学习及听说课的比重,也可适当加入专业术语的学习;第二学期重点为阅读技能训练,就要扩大阅读量,相应增加自主学习任务中的阅读内容,并适当加入专业英语篇章的阅读;第三学期重点为翻译与写作技能训练,可相应增加翻译写作内容,如英汉语言对比、英语句式写作训练及英汉互译技巧等;第四学期重点是综合应用能力训练,可以根据班级整体情况合理布置任务以强化其弱项。
  根据现有研究,任务教学法的实施分为三个阶段,即:前任务阶段(Pre-task)、任务阶段(Task cycle)、后任务阶段(Post-task)。以下就按照这三个阶段来阐述任务教学法在大学英语教学新模式中的具体应用。
  1.前任务阶段。在听说课上进行。在这一阶段,首先要向学生说明任务要求、任务目标、任务评价标准。接着导入新的语言学习项目,激发学生对已掌握的语言知识进行重构,激活与任务相关的背景知识,减轻任务完成过程中的认知负担。具体做法是:在课堂上,提出几个与主题相关的问题,或者播放与主题密切相关的英语短视频或音频,引导学生积极思考与发言,鼓励他们说出自己所知道的信息,并将关键词及短语列在黑板上。最后布置自主学习任务,可以包括以下方面:(1)利用自主学习软件自习课本单元内容,包括词汇的学习,课文的理解及课文结构分析等并完成练习进行自测;(2)利用网络查阅或听取中英文资料,进一步学习相关知识,写一篇不少于120词的小作文;(3)以小组为单位,从老师列出的口语交际情境任务中任选其一合作完成。任务可以是根据给出的情境,编写英文对话或短剧,并在课堂上展示演出。根据任务教学法的實施原则,布置任务要做到以下几点:(1)任务情境要尽量贴近生活,使语言学习与现实生活中的语言运用结合;(2)明确学生要完成的任务;(3)激发起学生求知探索的欲望,使他们在任务的驱动下去学习语言知识,进行技能训练;(4)任务要引导学生掌握思考、讨论、交流、合作等方式。
  2.任务阶段。在自主学习课上或课后,由学生自习本课内容及相关知识,完成各自的学习任务,小组讨论合作完成小组任务。在这一阶段,任课教师可以在自主学习平台上跟班辅导监督,掌握学生网上学习进度,学习热情和学习效果,对学生提出的问题予以解答并记录,对学生完成任务时遇到的困难提供帮助,同时对学生的学习效果进行记录。在这一过程中,老师需要将记录的问题及学生学习情况进行思考整理,充分准备,在后任务阶段的面授课上解答学生遇到的共性问题,并对学生任务完成过程中的情况进行总结评价。对于学有余力,超前完成任务的学生,可以给他们推荐一些相关的,或教师认为好的音像或视图资料进行学习。在任务阶段,一定要记住:学生是完成任务的主体,教师的角色应定位为“教学资源、信息的提供者”“学习过程的辅导监督者”“学习的引导促进者”,切勿越俎代庖。
  3.后任务阶段。在听说和读写译面授课上,教师在检查任务完成情况的基础上,进行总结评价,鼓励反思与巩固,鼓励学习者进行重构练习。在读写译课上,老师可以解决前任务阶段所布置的前两项任务。这时,需要将学生的注意力转移到语言形式上来,强调语言使用的准确性。经过前面两个阶段,学生对学习内容已经有了较全面的了解,在此基础上,再帮助他们分析、归纳、总结语言形式上的用法、规则就容易多了。首先,教师根据各环节中学生出现的问题记录,通过完成课前精心设计的具有针对性的活动来强化语言点,与学生共同分析,并通过指导,给学生提高语言准确性的机会。这种由师生共同合作,结合任务进行的讨论分析,能够达到巩固新知的目的。然后,检查学生的作文完成情况,任选几篇作为范文,先让同学们指出其中的优缺点,教师再给与评价。或者分小组互相传阅,互相评价。在听说课上,教师可以检查学生情境任务的完成情况并进行评价记录。
  (三)学习评价方式
  大学英语教学改革新模式要求改变传统的单一的学习评价方式,把评价学生阶段学习成果的形成性评价和评价最终学习成果的终结性评价结合起来。任务教学法的应用有助于将多种评价方式有效结合。其一,因为在教学过程中师生角色的转变使教师们有更多时间去关注学生的学习过程并给予评价,如听说课上,学生在展示情境会话时,或者在读写译课上传阅作文时,就可以采用学生自评、生生互评、师生评价等方式对学生完成的任务做出评价反馈。其二,自主学习平台可以记录学生的线上自主学习情况,便于教师们把自主学习过程作为形成性评价的计分依据来统计。这样,教师和平台的适时评价反馈可以提升学生的自信心,持续激励学生主动学习,调控学习进程,提高学习效率。同时,教师们也能够及时了解学生的学习动态,有的放矢地扮演好辅导监督者、引导促进者的角色。
  (四)教师面临的挑战
  大学英语教学改革新模式下,应用任务教学法对教师们是一个巨大的挑战。首先,教师需要转变长期以来所持有的“知识传授为主”的教学理念,理清师生角色,回归学习者的主体地位。有人认为教师省去了课堂上对许多知识点的讲解转变为由学生自主学习,减轻了教师的工作量。其实不然,与过去的重点研究教材,然后进行课堂知识传授的单一教学方式相比,新的教学模式不仅要求教师熟悉教学内容,还需要花大量时间学习现代信息技术,充实学习资料,设计教学任务。最重要的是需要对学生的任务完成过程进行监督辅导,对任务完成情况做出及时的评价和反馈,努力激发学生学习的内在动力和潜力,这些都对大学英语教师提出了更高的要求。
  结语
  任务教学法的主旨是“以任务为主线,以教师为主导,以学生为主体”。通过让学生用英语自主或合作完成各种贴近实际工作生活中的任务,可以调动他们学习英语的积极性,培养其语言能力、交际能力、学习工作能力,提高其综合文化素养。任务教学法的应用实现了教学中以教师为中心到以学生为中心的转变,顺应大学英语教学改革的趋势。而基于计算机网络英语教学与课堂教学相结合的新型英语教学模式为任务教学法的实施提供了便利的条件,运用得当,将会大幅提升教学效果。当然在变革和探索的过程中,需要广大大学英语教师们付出巨大努力。
  参考文献:
  [1] 中华人民共和国教育部.大学英语教学基本要求(试用)[M].上海:上海外语教育出版社,2004.
  [2] 中华人民共和国教育部.大学英语教学基本要求(试用)[M].上海:上海外语教育出版社,2007.
  [3] 教育部大学英语教学改革联络办公室.大学英语教学改革工作简报:四[Z].2005.
  [4] ELLIS,R.Task-based Language Learning and Teaching[M].Oxford:Oxford University Press,2003.
  [5] KRASHEN S.The Input Hypothesis:Issues and Implications[M].London:Longman,1985.
  作者简介:崔素花(1980—),女,汉族,山西太原人,山西中医药大学国际教育学院讲师,研究方向为大学英语教学、医学英语教学。
  汤晓媚(1981—),女,汉族,浙江台州人,山西中医药大学国际教育学院讲师,研究方向为大学英语教学、语言测试。
  张冉(1985—),女,汉族,山西吕梁人,山西中医药大学国际教育学院讲师,研究方向为大学英语教学、医学英语教学。
  (责任编辑:易衡)   四、总结
  (一)本文探讨了基于 LDA 主题模型的形势与政策 教育创新与实践,尝试将研究型学习引入大学生形势与政策教育,提高学生参与度和积极性,在实践中取得了较好的效果。参与学生普遍反馈,自己在教育过程中得到 了深度参与,从知识的被动接受者变为知识的生产传播 者,这种主人翁意识的出现明显提升了学习积极性,学生 关心时事和政策的积极性大大提升。
  (二)通过基于国务院新闻信息文本数据的 LDA 主 题模型计算结果可以看到,所有主题可以分为三类:常规 型主题、周期型主题和节点型主题,LDA 主题模型在数 据降维和整合信息以便于开展教育活动方面展现了良好 的素质。并且通过和新华社评选的 2020 年国内十大新 闻进行对比可以发现,常规型主题和节点型主题包揽了 所有十大新闻。原因是,常规型主题多为国家的重大路 线、方针、政策,本身即具有成为重大新闻的“潜力”;而 节点型主题通常与重要会议、决策和重大成就相关,往往 具有重要的社会意义而成为重大新闻评选的“常客”。
  (三)本次实践作为一次尝试,仍然有许多不足之处。 比如,虽然咨询了新闻从业者的意见,但主题的划分仍然 具有主观性,相关标准尚需进一步合理化;2020 年度的 新闻信息,理应在更长的时间跨度上选取并进行相关研 究,这样对国家形势与政策的描绘和把握将会更加准确。 本文针对所有领域开展了研究,下一步还可以根据学生 的兴趣、特长,有针对性地选择若干领域如经济、军事、外 交等开展更为细致的研究型学习。
  注    释:
  ①“四个自信”即中国特色社会主义道路自信、理論自信、制 度自信、文化自信。
  参考文献:
  [1] 王建红 , 金雪涵 , 王葆 . 网络中的“大学生”话语生态特 征研究 —— 基于网络文本的 LDA 分析 [J]. 青年发展论 坛 ,2020(5).
  [2] 王建红 , 王曼曼 , 杜宝彪 . 中国消费领域社会关注变化趋势 研究——基于人民网经济新闻排行榜文本的 LDA 模型分 析(2007-2017)[J]. 保定学院学报 ,2019(2).
  [3] 新华社评出 2020 年国内十大新闻 [EB/OL]. 新华网 .(2020-12-29).http://www.xinhuanet.com/politics/2020-12/29/c_1126919544. htm.
  作者简介:马梦祥(1992—),男,汉族,河南洛阳人,单位为华北电力大学,研究方向为大学生思想政治 教育。
  (责任编辑:御夫)
其他文献
一个人的行为模式可以向别人展示出一个人的社会地位、文化背景和家庭教育水平等等。中国人常使用宴请客人的方式来增进友谊,促进沟通,所以人们必须在就餐沟通过程中注意餐桌
突如其来的新冠疫情给高校教学带来严峻挑战的同时,也为教学模式改革提供了新契机。如何贯彻以学习者为中心的教育理念并有效完成既定教学目标,成为信息化背景下大学英语线上
摘要:长江三角一体化发展为长三角地区公共图书馆的发展提出了时代性要求,長三角图书馆为要服务于 社会发展和文化建设,需要建立图书馆共享机制。实现资源共享可以从两个途径开展,一是发挥中心区域图书 馆的引领作用;二是挖掘各地各类图书馆自身特色。实现制度共享应出台通用性规章制度,建立相应的保障制 度和监督机制。长三角地区图书馆联合管理机构除日常管理外,还应特别注意开展四个方面的工作:组织长三 角各图书馆的
摘要:越来越多中国企业选择通过 VIE 结构“走出去”,而我国政府也逐渐开始对如何规制使用 VIE 结构的 企业进行了制度上的尝试,展现出我国对于 VIE 结构内化吸收的进路。VIE 结构最需要解决的问题便是其合法 性和避免风险问题,可考虑通过税制、股权安排、信息披露、司法及执行等尝试性的举措进行克服。治理好 VIE 结构需要监管部门内部通力合作、企业管理者们的协作、学者与实务人士共同探究。若能以
民俗文化是我国传统文化的重要组成部分,其记载了中华民族的发展变迁,蕴含着中华文化的精神。作为民俗文化之一的《牡丹亭》,记载了说唱艺术、娱乐文化,插图绘画等内容,让民
虚无主义思想对人生具有较强的破坏性影响,《一个干净明亮的地方》是体现海明威虚无主义思想的一部代表作,文中无论从主题立意还是人物刻画与细节描写都体现了深刻的虚无主义
文化是时代向前发展的根本动力,在传媒新时代,微信作为重要的交流工具影响着人们的生活。古诗词微信表情包在现代生活中的应用具有广泛性和普遍性。古诗词表情包传播了传统文
摘要:关于“新生患儿救不救”的案例引发深思,对“救不救”的问题根据相关伦理学原理进行分析,无论 是美德伦理学、义务论、功利主义、人权—生命权、汉斯·约纳斯的责任理论,均为“救”提供了依据,医生和父母 应当选择“救”。但是问题依旧存在,谁来决定“救不救”?根据相关法律以及医学伦理学的标准,“救不救” 这个问题的主要决定权还是在患儿的父母手中,这一认定虽然没有摆脱责任“两难”困境,但是伦理学原理为 合
王力军收购玉米案的两次判决结果差异如此之大,在哪一个环节出了问题,是立法本身的问题还是法律适用的问题,不解决法律存在的问题,随意解释法律或者无限扩大法律适用中法官自
摘要:在审查奸淫幼女案中,嫌疑人和受害幼女双方自愿发生性关系时,对幼女年龄“明知”认定时,公诉 机关常常陷入一律以强奸罪定罪处罚、抑或因嫌疑人主观明知要件的待证和缺失而导致无法定案,甚或无罪情 况的尴尬境地。对奸淫幼女行为中幼女年龄的“明知”大致分为确实明知、应当明知、拟制明知三类;但对奸淫 幼女“明知”实践断案中的“幼女的承诺”“行为人的认识错误”和“公共政策”等因素也可能影响案件法律 定性。具