概率主题模型相关论文
推荐作为社会网络分析、数据挖掘、信息检索等领域的核心技术,已被广泛应用于在线情感咨询、垃圾邮件过滤、网页排名等众多领域。......
鉴于传统方法在赌博网站检测上时效性低、准确度低,提出基于PAM概率主题模型的赌博网站检测方法。抽取网站及其关联网页的文本内容......
网络技术的发展促使人们热衷于在互联网上分享旅行经历,游记文本是一种主要形式。游记中蕴含着地点代表性知识(景观、风格、特色活......
随着互联网技术的快速发展,网络上以文本形式存在的信息迅速增加,如何有效地组织和管理这些文本信息是当前信息科学领域面临的一个......
跨文档共指消解(CrossDocumentCoreference,CDC)是以分散在不同文本来源中的相同名词实体为对象,通过信息抽取、信息表示和聚类等......
当今的互联网处于大数据爆炸的知识时代,每天都会产生各种类型、各种结构的海量数据资源等待有效利用和深层挖掘。其中文献数据是......
随着拍照设备和社会媒体的快速发展,每天在社交网络中出现的图片数量数以亿计。面对如此海量的图像数据,寻找一种能够正确分析和理......
近些年来,概率主题模型在文本分析领域的应用越来越广泛。这是因为主题模型用于文本分析有下面几点优势:一个是主题模型有良好的数......
信息科学和技术的快速发展,互联网、多媒体、移动设备存储和传输的数据迅猛增长使这个高度信息化的时代充满生机与活力。以计算机......
学位
如今,主题模型已经被广泛应用于文本分析中。一些已经问世的主题模型,比如基于概率的隐式语义分析法(Probabilistic Latent Semantic ......
临床路径是指针对某种症状或疾病制定的有严格工作顺序和准确时间要求的标准化的诊疗计划,对规范诊断治疗行为、提高医疗质量、控......
如今,网络多媒体技术正在迅猛地发展,各种图像数据库中的图像数量呈现爆炸式增长。如何对这些图像进行有效的管理与快速的检索是一个......
对标有文本词的图像数据进行调研,发现真实图像中被标注的事物往往占整个画面的部分较大,而现有的图像标注工作没有考虑这一信息,......
期刊
针对现实文本分类环境下通常仅有少量标记样本而影响分类精度的问题,提出了一种基于概率主题模型潜在 Dirichlet 分配的分类算法。......
针对微博内容较短、歧义较大的问题,利用概率主题模型对用户的兴趣进行建模,提出了一种基于用户兴趣的微博实体链接方法。具体地,......
主观性句子识别旨在发现文本集合中具有观点的句子。本文基于概率主题模型,提出融合主题的主观性句子识别模型。该模型通过考虑主题......
本文主要关注多视图数据的分类问题.考虑到集成分类方法可组合多个弱分类器构成一个强分类器,以及主题模型能学习复杂数据的语义表......
视频监控是计算机视觉研究最热门的应用领域之一,其中复杂监控场景的行为分析是一项基本任务。复杂监控场景是指运动目标多且密度......
随着大数据时代的来临,如何有效从海量的文本数据中挖掘和分析主题特征已成为学者们的研究重点。隐含狄利克雷分配(Latent Dirichle......
Replicated Softmax model,是用于文本数据挖掘的无向概率主题模型,为描述语料库的主题分布提供了一个功能强大的框架.然而,作为一......
大数据时代的到来使得文本数据的数据量暴增,因此准确而高效地识别和分析文本数据的潜在结构变得越来越重要。要从海量的数据中挖......
基于混合策略个性化推荐的思想,为进一步提升业务套餐型产品的个性化推荐的准确性,提出了基于特征增益与多级优化的协同过滤推荐算......
训练集中文本质量的好坏直接决定着文本分类的结果。实际应用中训练集的构建不可避免地会产生噪声样本,从而影响文本分类方法的实际......
大部分传统的基于距离尺度学习的图像标注方法假设训练样本之间存在确定的约束关系。这样的假设在小规模、精准的数据集上可以取得......
本文针对多文档摘要没有考虑实体、仅仅生成通用摘要的问题,提出面向实体的演化式多文档摘要生成方法。本文首先利用一个概率主题模......
为了实现图像内容类似文本化的表达,建立图像内容与文本之间不确定性的关联关系是机器视觉研究的难点问题。概率理论为解决这种不......
极光是发生在地球南北极高空的一种大规模放电现象,蕴含着丰富的物理意义,研究极光的产生机制有助于深入探讨地球磁层的变化规律和......
在介绍概率主题模型发展过程以及概率主题模型的代表性模型LDA基本原理的基础上,分析LDA模型的特征及其用于微博类网络文本挖掘的......
随着网络信息的爆炸式增长和推荐技术的发展,新闻推荐系统也逐渐出现在人们的视野中,并且发挥着越来越重要的作用。新闻推荐系统使......
对海量的科技文献资源进行知识挖掘能够发现大量有价值的、潜在的知识,有效地提高文献信息的可用性。作者前期研究验证了使用LDA主......
在当今信息爆炸的时代,如何从海量的信息中快速地过滤掉无用信息,筛选出用户最感兴趣的内容是当前亟待解决的问题之一。推荐系统可......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
随着科学技术的进步,人们现在越来越容易获取和存储各种视频,数字视频信息出现了飞速膨胀。视频运动目标检测是视频内容分析的基础......
结合数据挖掘、主题建模、网络分析等多源融合的大数据分析法,针对网络空间治理政策及部门协同进行研究,对政策提升与机制优化具有......
在学术社区提供的服务中,对于研究者特别是青年研究者来说,专家推荐是一个必不可少的部分.目前提供学术信息服务的所有中文搜索引擎中......
PLSA(Probabilistic Latent Semantic Analysis)是一种典型的主题模型。复杂的建模过程使其难以处理海量数据,针对串行PLSA难以处......
概率主题模型是一种统计生成模型,它从文档集合中抽取一系列主题,并将这些文档表示为不同主题依照一定概率混合而成.通过这种模型发现......
随着互联网和信息技术的不断发展,网络已经成为一种人们获取信息的重要途径。面对着互联网上产生的海量信息数据,如何从浩瀚的信息......
文本聚类是指利用计算机自动识别文本集合中类簇的技术。随着大数据(Big Data)时代的到来,互联网上不仅流动着由多样化应用而产生......
潜在狄利克雷分布(LDA)模型是主题挖掘领域的重要方法之一,为深入了解该领域的研究进展,对2012到2016年5年期间该模型相关研究成果进......
通过大脑对外界环境感知的神经结构与认知功能的相关研究,构建仿脑的媒体神经认知计算(multimedia neural cognitive computing,MN......
蛋白质是细胞生命活动中最重要和最多样的一种大分子物质,蛋白质功能的研究对新药的发现、作物改良以及人工合成生物化学物质都具......
针对现有图像标注方法大多将不同类别的图像置于同一主题空间下进行标注的不足,提出了一种新的图像标注方法,该方法以Corr-LDA模型......
互联网技术的不断进步充分带动了电子商务的迅猛发展,越来越多的人倾向于在网络上购物。在购买完商品后,消费者往往都会在各大电商......
随着IT产业尤其是互联网的蓬勃发展,人类社会逐渐进入了大数据时代,我们每天都可以通过多种渠道接触到海量的信息。如何从信息的海......