【摘 要】
:
为了从日益丰富的蒙古文信息中快速准确地检索用户需求的主题信息,提出了一种融合主题模型LDA与语言模型的方法。该方法用语言模型与LDA模型对蒙古文文档进行建模,利用吉普斯抽
【机 构】
:
内蒙古师范大学计算机与信息工程学院
【基金项目】
:
国家自然科学基金资助项目(61562068);内蒙古自然科学基金资助项目(2013MS0912);内蒙古自治区教育部人文社会科学研究项目(13YJAZH080)
论文部分内容阅读
为了从日益丰富的蒙古文信息中快速准确地检索用户需求的主题信息,提出了一种融合主题模型LDA与语言模型的方法。该方法用语言模型与LDA模型对蒙古文文档进行建模,利用吉普斯抽样方法进行推理间接计算模型的参数,挖掘隐藏在文档内不同主题与词之间的关系,得到文档的主题分布,并以此分布来计算与检索关键词主题之间的相似度,最后返回与该主题最相关的文档。语言模型充分利用蒙古文语法特征以及统计信息,而主题模型LDA又具有良好的潜在语义挖掘及主题发现的泛化学习能力,从而结合两种方法更好地实现蒙古文文档的主题语义检索,提高检索
其他文献
本文分析了民航服务文化的建设问题,旨在提供一种帮助民航企业在战术层面上实施服务的思想,使员工成为公司真正意义上的利益共同体,帮助公司赢得竞争。
This paper analyzes
从理论上研究马约拉纳费米子-量子点杂化系统的输运性质.基于广义主方程方法,计算通过此系统的电流、微分电导和Fano因子.计算结果表明:马约拉纳费米子与量子点中电子的耦合导
1.引言作者关于长波天波场强和中波近距离天波场强预测的两文~([1、2])发表后,国内、外不少读者提出了一些问题,希望了解文中提供的近距离天波场强数据的测量方法。本文试图
变速器顶盖高强度螺栓压装是变速器总成装配的难点之一,本文通过分析变速器总成装配精度和工艺要求,设计一套顶盖高强度螺栓压装夹具,压装精度高,迅速快捷,操作方便,使用便捷
文学经典是中华文化不可或缺的组成部分,是中华民族的宝贵财富。阅读文学经典,能够增进学生对中华传统文化的理解和把握,有利于发扬我国优秀传统文化,对继承和传承民族文化有
我省第一批37个特色小镇创建名单公布已有些时日,但仍有许多人疑惑:为什么像乌镇、西塘、横店、柳市等赫赫有名的传统名镇、强镇没能入选?$$ 其实,特色小镇并不是传统意义上的“
目的探究在剖宫产术中应用右美托咪定复合罗哌卡因进行腰麻-硬膜外麻醉的临床效果。方法随机分组2018年5月至2019年1月医院妇产科需要行剖宫产术的120例产妇进行研究。一组60
<正> 本文从宏观层次分析了铁路提速的政治战略意义,提升国际竞争战略意义,促进产业结构升级和优化作用,可持续发展意义:本文从交通运输业产业层次分析了铁路提速优化交通运
当前企业的作业成本管理,主要看重的是"作业",应用好企业的作业成本提供的信息,才能将管理的重心深入到企业,深入到作业的层次。作为企业管理和企业管理的核心出发点以及重点
医疗质量是医院的生命,提高医疗质量是医院管理的永恒主题,传统的医疗质量管理模式以终末质量评价与反馈为主,缺少对环节和过程质量的控制手段。通过医疗过程的前馈控制、反