一种面向涌现的比较性话题模型

来源 :国防科技大学学报 | 被引量 : 0次 | 上传用户:maomao1983520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进行参数推导。在多个实际数据集中通过定性和定量的方法对模型进行评价,实验表明,模型不仅能够发现不同文本集间的异同,而且在模型困惑度指标上相对当前两种主要跨文本集的话题模型具有明显的优势。
其他文献
针对嵌入式系统开发平台构建中的硬件环境差异问题,给出了一种高移植性的硬件抽象层设计方案,并介绍了实现方法。该硬件抽象层给出底层封装规范并向上层软件设计提供操作接口规
近年来,国内已出版了多本有关“数学学习论”的专著,这对于系统的进修与学习是很有益的.《“数学学习论”导引》(张国杰编著,西南师范大学出版社出版)一书则另辟蹊径,以问答
第一次世界大战(欧战)的爆发引起了中国知识分子对中国自身的强烈思考,《东方杂志》对此有大量的报道,以《东方杂志》的报道为中心进行考察,可见在欧战的三个阶段,引起中国知
本文基于桥梁结构可靠度基本理论,针对现有可靠度分析方法在工程应用中存在的问题,将BP神经网络与改进JC算法相结合,对钢管混凝土拱桥正常使用极限状态可靠度进行计算,为钢管
随着成都经济持续稳定的发展,会展业已逐渐成为成都经济增长的一个新亮点。因此,对成都会展业发展的研究,有助于进一步发挥该行业具备的优势和潜力。会展业集聚对成都会展产
就可行性而言,全面推进随班就读工作具备如下条件:(1)义务教育阶段随班就读经验为推进随班就读工作奠定了基础;(2)当前普通教育环境发展形势有利于推行随班就读工作;(3)国内
图式理论在经历了二百多年的发展之后,对该理论的研究已经取得了斐然的成就。国内学者普遍认为,图式理论的研究的焦点主要集中在用图式理论来分析语言学习者的理解过程,主要
<正> 一、栽培技术凉粉草一般产干草300余千克,干草市价每千克12~14元,产值3000余元。 1.繁苗凉粉草种子不能作种,需采用无性繁苗法繁殖种苗:①分株法。春季气温10℃以上时,其
改革开放后,随着中国大陆地区培智教育的恢复,人们越来越关注对智力落后儿童的认知研究。本文通过中国学术期刊网全文数据库,检索了1980年至2009年的相关文献,主要从知觉、记
任何管理思想的提出,都离不开对于人类本质的认识;任何管理模式的建构,都以对人的解读为前提和基础。由于对人的不同解读,才造成了管理思想和管理模式的差异。人本管理就是把