基于话题建模的交互文本语境分析技术研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户：linmao820521

【摘要】

：

计算机支持的协作学习已经成为信息技术环境下一种重要的学习方式。现有的学习管理系统、学习社区几乎都提供学习者交流论坛。学习者在线交流时所产生的交互文本在数量增长上

【作者】

：

张永和

【机构】

：

北京师范大学

【出处】

：

北京师范大学

【发表日期】

：

2012年期

【关键词】

：

计算机支持协作学习交互分析文本挖掘技术话题建模 fCE算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

计算机支持的协作学习已经成为信息技术环境下一种重要的学习方式。现有的学习管理系统、学习社区几乎都提供学习者交流论坛。学习者在线交流时所产生的交互文本在数量增长上具有突发性、在内容方面具有发散性,从而给学习者和教师带来文本阅读的困难,不利于他们对讨论进展的及时把握。减轻文本阅读的负担将有利于促进协作学习的有效进行。因此,本论文研究如何利用文本挖掘技术支持交互文本的阅读理解。　　话题建模(topic modeling,又称主题建模)技术主要用于从文本集合中抽取主题信息,是当前文本挖掘领域的研究热点。然而,如何提高所挖掘的主题信息的可解释性是当前主题建模的一个难点。从语用学的角度看,文本符号的语义解释依赖于一定的语境;增加符号的语境信息,可以降低符号解释的不确定性。由此,本研究的主要思想是通过语境信息改善主题建模结果的可解释性。　　本研究内容包括如下方面:　　(1)提出一种文本语境的概念模型及其框架表征。这种语境框架表征由一个焦点槽及多个语境槽组成。焦点槽值是一个代表实体或事件的词语,表示语境的中心概念。语境槽包括相关属性槽、相关事件槽与相关实体槽三种,分别表示与焦点相关的三类语义信息。一篇文档可以包含多个语境框架;不同的语境框架间通过共同的槽值进行关联,从而形成象征文本主题的语境框架网络。这种语境框架网络可以采用表格和可视化两种方式呈现。为了从文本中抽取语境框架,设计了fCE算法,适合于处理单主题的文本集合。　　(2)提出一个新的主题模型fLDA(frame-oriented latent Dirichlet allocation,面向框架的潜在Dirichlet分配),用于从文本集合中挖掘多个主题,并采用语境框架网络表示每个主题。本文通过数学推导证明,在给定同一主题的条件下,fLDA具有与LDA相同的词语概率分布,这说明fLDA可以替代LDA进行主题建模。而且,fLDA在LDA的主题表征方法的基础上增加了主题词的语境信息,从而更好地支持对主题的解释。本文通过三组实验(可操作性评价实验、语义标注性能实验、主题建模性能实验)说明fLDA方法在支持主题解释方面的有效性。可操作性评价实验说明,fLDA辅助下的文本摘要比起完全人工的文本摘要在可操作性方面具有更高的平均用户评分;语义标注性能实验说明本方法的标注结果与人工标注结果无显著性差异;模拟实验对比了标准的Gibbs抽样算法与三种修改方法,说明其中一种方法(M+方法)具有更好的召回性能和稳定性。本文通过案例对比基于fLDA的文本摘要与完全人工的文本摘要,对比分析发现存在这种差异性的一个重要原因是fLDA算法缺乏对用户经验进行建模。　　(3)为了改进fLDA在用户经验建模方面的缺陷,提出一种半监督的主题建模方法,sfLDA(semi.supervised frame-oriented latent Dirichlet allocation)。sfLDA采用基于规则的方法建模用户经验。案例分析说明sfLDA可以有效地修正fLDA的结果,得到符合用户经验的主题建模结果。　　(4)为了利用sfLDA支持交互文本的阅读理解,本研究设计和实现了可视化工具ContextPreviewer。ContextPreviewer通过关键词识别、主题识别、语境可视化以及语境相关内容检索来支持读者的阅读理解过程。案例研究展示了ContextPreviewer在辅助文本阅读中的可行性。　　综合以上研究内容,本文具有如下两个方面创新点:　　(1)提出了一种文本语境的概念模型及其框架表征方法。这种文本语境的框架表征方法可以为文本的关键词集合补充语境信息,将多个关键词通过语境信息进行关联,从而改善关键词集合所表征的文本主题的可解释性。　　(2)基于LDA模型提出了一种半监督的主题模型,sfLDA。sfLDA用于自动地从文本集合中抽取以语境框架表征的主题信息,并允许以规则形式约束主题建模结果,使之符合用户的主题划分经验。

其他文献

北京市小学科学教师自主发展的现状调查与对策研究

教师自主发展是教师专业发展的最高境界。笔者从教师教育发展的历程、时代发展的诉求、学生成长的需要和科学学科的性质等视角阐述小学科学教师应进行自主发展。小学教师自主

学位

小学科学教师自主发展专业素养教研活动探究式教学

课堂网络环境下小学生空间观念发展研究

空间观念是小学数学培养的一项重要能力,对学生以后的学习和发展都起着重要作用。随着教育信息化的发展和推进,计算机多媒体技术越多越多地应用到数学教学中,尤其在空间几何

学位

空间观念多媒体技术小学几何课堂教学师生交互

合作问题解决中的惯例及其影响因素

惯例是人们在重复解决同一问题时形成的程序化行为或策略,它既可被视为模式化行为,也可被视为作为策略或决策选择,甚至被视为组织的基因。本研究将其界定为:两人或多人在面临

学位

惯例合作问题解决微观发生法表征重述评价指标

用废泡沫制民用建筑防水胶

期刊

废泡沫民用

弘扬延安精神增强三种意识

延安精神是中国共产党和中国人民在长期的革命奋斗中形成的优良传统和宝贵精神财富。延安精神所包括的坚定正确的政治方向,解放思想、实 Yan’an Spirit is a fine traditio

期刊

延安精神宝贵精神财富解放思想政治方向领导干部政治素质人民群众执政为民节俭意识思想路线

车裁GPS系统常见故障处理及使用注意事项

一、GPS系统组成及基本原理rnGPS系统即卫星导航及定位系统,主要由空间部分、地面监控部分和用户部分组成.

期刊

GPS系统常见故障处理卫星导航空间部分基本原理定位系统地面监控部分和户部分组

海南省推荐五防轻体隔墙板

期刊

八年级学生的概率素养及其测量

随着数学素养受到越来越多的关注，学生的概率素养也受到更多的重视。概率的应用日益广泛，概率论也具有重要而独特的学科价值，并且我国的课程标准对概率的学习和评价提出了新的要

学位

数学教学中学生概率素养测量评价学业成绩

瑜伽锻炼对高校女大学生自信心及疲劳状况的影响研究

自信心是一个多层次的心理系统,对个人的成长和发展起着重要作用。当代大学生面对一个充满竞争和挑战的时代,有更多的选择也有更多的困惑,容易导致各种心理健康问题,是大学生

学位

瑜伽锻炼女大学生疲劳状况心理健康肺活量

基于“组织学习车”的学习型组织创建研究——以A公司汽车经销商销售员培训为例

近年来，学习型组织以其扁平化的管理方式、团队化的学习氛围、学习与工作相结合的形式受到了国内外企业的好评。于是，许多企业开始审视自身的培训问题，将目标转向了企业学习型组

学位

职工教育员工培训绩效评估教育工程学

基于话题建模的交互文本语境分析技术研究

与本文相关的学术论文