【摘 要】
:
随着互联网信息技术的快速发展,以网络为载体的多种形式的文本数据迅速增长。如何从海量的文本数据中快速且智能的挖掘出有价值的信息成为人们的迫切需求。主题模型技术自被
论文部分内容阅读
随着互联网信息技术的快速发展,以网络为载体的多种形式的文本数据迅速增长。如何从海量的文本数据中快速且智能的挖掘出有价值的信息成为人们的迫切需求。主题模型技术自被研究学者提出起,就成为处理文本信息挖掘问题的重要手段和有效方法。然而,由于传统的主题模型在进行文本建模中,将文本作为“词袋”模型进行处理,其中每个文本中的单词被当作相互独立的个体。这种缺乏人类附加知识的无监督学习算法,往往取得令人困惑的结果,即学习到的主题有时使人难以理解,缺少语义上的一致性。为了解决这类问题,如何有效的将先验知识融入到主题模型中,以获得语义一致性更好的主题是主题模型研究的一个热点方向。同时,随着搜索引擎技术的迅猛发展和知识图谱相关研究的兴起,知识图谱技术也逐渐被应用于各种技术和服务产品中,同时各种类的知识库也先后建立并且规模正在飞速的增长。虽然知识图谱技术日益成为新的研究热点,各种知识库提供了丰富的资源和大量的知识信息,然而如何有效的将知识图谱的技术和知识库的资源应用到其他领域的研究中,发挥知识库的影响力,仍然是一个难点。本课题研究基于以上两方面考虑,创新性的提出将知识图谱技术引入到传统的主题模型中的研究方向,利用知识图谱的表示技术抽象出实体相关性的先验知识,以一种附加约束的形式融入到主题模型中,以提升主题模型的效果,在LDA主题模型的基础上改进并提出了引入知识图谱约束的主题模型EC-LDA模型。通过实验设计,证明了该模型的合理性和有效性,并通过对比实验,验证了该模型在建模效果和效率上的提升。
其他文献
随着大数据分析、物联网、移动互联等网络信息技术的快速发展,游客们对于旅游行业的信息化水平要求也越来越高。如何借助信息技术构建信息化公共服务体系,整合各类资源,提高旅游行业的服务水平和品质,对推动和促进旅游目的地信息化服务品质建设和旅游业的可持续发展起到十分重要的作用。本文结合旅游需求理论,公共产品理论、新公共管理等理论,结合旅游信息化相关实践进行分析,分析了信息化公共服务体系的指标基础因子,构建了
视频稳像技术是图像和视频处理领域的热点问题之一。传统的视频稳像方法大多采用后处理的方式,存在较长的延时。然而许多应用场景,如无人机的实时回传视频、手持摄像设备在线
在中国医疗健康服务不断转型的今天,“以患者为中心”的服务理念显得尤为重要。医改政策也在强调改革与改善服务同步,要求各医疗机构积极实施改善医疗服务行动,通过改善诊疗
在文本推荐中,文本中的关键词在文本集上出现次数较少,导致文本信息的缺失进而影响推荐效果。将这些词语看做知识图谱中的实体,则能够通过知识图谱中对实体的描述解决这类信
好莱坞犹太人是一个特殊的群体,他们创立了好莱坞制片厂体系和明星制度,几乎掌控着美国电影制作的话语权。然而,事业的成功和社会地位的提高并没有使他们免受反犹主义袭扰,自20世纪30年代纳粹上台后,他们所面临的来自欧美的反犹主义攻击更加猛烈。在种种因素作用下,好莱坞犹太人充分利用职业特性,采取一系列措施对反犹主义发起抗争。本文在结合国内外相关研究的基础上,通过对相关数据、新闻报道、电影素材等资料进行梳理
肺癌是全球最常见和死亡率最高的癌症类型。在肺癌筛查诊断过程中,计算机辅助检测系统(Computer-Aided Detection,CAD)能辅助医生进行肺部疾病的诊断和治疗,有效提高了诊断准
堕胎问题在美国一直是一个极富争议的话题,1973年“罗伊诉韦德案”做出的堕胎合法化的判决,更是使得整个美国社会在堕胎问题的立场上产生了严重分裂。美国天主教主教团作为美国天主教的领导机构,一直秉持着支持生命权的反堕胎理念,同时也在反堕胎运动中发挥了巨大的作用。但是,美国天主教主教团的努力,也只能减缓美国堕胎合法化的进程,“罗伊诉韦德案”的决定始终没有被反堕胎力量推翻。本文利对1973-1992年这一
纵观高铁施工建设到运营管理的全生命周期,路基工程的风险评价和沉降变形观测及评估是保障其高平顺性和高稳定性的先决条件和核心内容。随着我国高铁网的优化和高铁精密工程测量技术的更新,对高铁路基沉降变形的管控愈加严格。本文先从标准化层面上梳理高铁沉降变形测量体系和沉降评估工作及预警机制的要点。依托中国铁路上海局集团有限公司“路基沉降评估技术服务”课题,根据在建和在运营的高铁路基施工特点,总结路基全生命周期
软土土层在我国分布非常广泛,在软土地基上进行工程项目的修建往往需要对软土地基进行加固处理,当采用复合处理方案时,不同处理方式之间由于刚度差异,会导致差异沉降现象,所以有必要对其进行处治以确保工程安全。目前国内外对于差异沉降的研究集中于路桥过渡段与路基拓宽工程,本文首先对这两个方面的相关研究进行总结,并借鉴其治理方法与差异沉降控制标准运用于本文的研究中。随后结合云南磨憨车站大型铁路站场软土地基过渡段
在手势识别等领域中,由于多模态数据所蕴含的信息具有互补性,使用多模态手势数据协同进行手势识别可以有效提高识别准确率。首先,本文提出了一种叫做模态卷积的针对多模态视