潜在狄利克雷分布相关论文
近年来,随着网络攻击的发展变化,网络空间安全形势也越来越严峻。高级持续性威胁(Advanced Persistent Threat,APT)攻击作为目前发展......
潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一种流行的主题模型算法。它对每篇文本以及文本中每个单词进行主题层次上的聚......
互联网领域技术高速发展,产生了大量的网络数据,用户迫切需要以较快较准确的方法获取文本的核心信息,而搜索引擎给出的信息依然过多、......
随着计算机技术的不断进步,人类创造的数据正以爆炸式的速度增长,传统的集中式的信息检索在面对海量数据时往往不堪重负,分布式的信息......
随着互联网技术的广泛应用,呈爆炸性增长的数据资源给人们带来严重的信息过载问题.挖掘文本数据中的主题信息随时间变化的情况,可......
课堂话语作为课堂教学的重要媒介和主要手段,也是判断教师自身专业素质、教学理念和教学效果的重要指标之一。采用图式化和量化的......
铁路扣件是连接钢轨和轨枕的重要基础部件。传统的扣件检测依靠人工巡检,缺乏准确性和实时性。近年来,计算机视觉技术的高速发展为实......
图像的自动标注技术和基于语义的图像检索技术在多媒体信息检索领域有着重要的地位。图像标注满足了用户在海量图像数据库中进行关......
SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题单......
针对微博热点话题检测使用主题模型只能提取出无序话题词组合的问题,提出一种结合词激活力模型与主题模型各自优点的微博热点话题......
潜在狄利克雷分布(LDA)以词袋(bag of words,BOW)模型为基础,简化了建模的复杂度,但使得主题的语义连贯性较差,文档表征能力不强。......
针对LDA主题模型用于产品特征抽取中存在的问题,提出将句法分析和主题模型相结合的SA-LDA方法。首先基于句法分析对产品所在类别下......
针对传统"视觉词包(BOW)模型"识别铁路扣件状态时仅利用扣件图像的特征域,忽略其空间域中上下文语义信息的缺点,提出了一种基于上......
基于OpenMP技术提出并行置信传播算法,在多核服务器上通过共享内存的方式快速推断潜在狄利克雷分布(LDA)主题模型的参数,建立文本中不......
挖掘文档集合中主题词的概率分布可对文档内容做概要性了解。进一步探寻给定主题下单词之间的连接关系不仅能丰富主题词的含义,而且......
随着社交网络的不断发展,微博成为越来越多的人获取信息的平台。为了有效解决微博话题检测中海量短文本带来的词稀疏问题,提出结合......
分层分布式狄利克雷分布(HD-LDA)算法是一个对潜在狄利克雷分布(LDA)进行改进的基于概率增长模型的文本分类算法,与只能在单机上运......
针对口语对话系统领域分类任务中传统领域分类方法如SVM需要进行大量人工标注的问题,将LDA(Latent Dirichlet Allocation)模型应用......
主题模型可以学习用户和推荐项目的潜在主题分布。提出了一种基于双向主题模型的协同过滤算法,分别学习用户和推荐项目的潜在主题分......
针对海量文本信息的挖掘与处理是目前文本挖掘领域的一个热点问题,LDA模型是文本挖掘领域中应用广泛的一种主流模型。LDA模型能够......
[目的/意义]使用融合多属性的量化方法,快速且有效地挖掘出领域内多个技术创新主题,为技术创新方向的确定提供借鉴。[方法/过程]将......
当今的社交网络拥有庞大的用户数量和随之而来的海量信息,可以为工业界各个领域的研究提供重要的数据补充。其中,如何高效准确地对网......
潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一种流行的概率主题模型,能够从大量的非结构化文档集合中抽取出隐含的语义......
实体链接任务主要包括命名实体识别、查询扩展、候选实体选择、特征抽取和排序。本文针对查询词的扩展,提出了一种基于词向量的扩展......
针对传统"视觉词包模型"在进行底层特征编码时存在较大的量化误差的问题,提出一种基于近义词分配的铁路扣件状态检测模型。首先,利用......
极光是发生在地球南北极高空的一种大规模放电现象,蕴含着丰富的物理意义,研究极光的产生机制有助于深入探讨地球磁层的变化规律和......
改革开放以来,随着国内经济快速发展,国际地位不断提升,城市功能日益完善,越来越多的大型活动开始登陆大中等城市。大型活动客流总......
短文本一般具有篇幅较短、特征稀疏、信息量不明显等特性,直接使用传统的文本分类方法进行分类的效果一般不理想。潜在狄利克雷分......
地理位置作为用户生活轨迹的具体表现,在人群分类中有着举足轻重的作用。地理位置数据具有高维稀疏性,已有人群分类方法需对位置数......
为了提高文本相似度检测算法的准确度,提出一种结合潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)与Doc2Vec模型的文本相似......
针对潜在狄利克雷分布(LDA)模型忽略特征单词明确性的问题,提出一种嵌入标记信息的主题模型WL_LDA。设计一种基于SIFT特征点约束单......
随着现代信息技术的迅猛发展,Web2.0时代开启了人类史上真正有意义的互联网在线学习之旅。信息运行载体和传播形态的改变导致学习......
社交网络尤其是微博中含有大量的短文本。短文本不同于传统的文本,其携带的语义特征信息密度低,很难对其进行准确的主题挖掘。针对......
期刊
基于会话的协同过滤用固定时间窗划分交互历史并将用户兴趣表示为这些阶段的序列,但是旅游数据的高稀疏性会导致某些阶段内没有交......
卷积神经网络(Convolutional Neural Network, CNN)在图像视频分析中比传统方法有更高的准确率和快速的处理速度,利用CNN进行视频......
通过研究青岛市市长公开电话的文本数据,提出了地点词的自动获取算法,并对文本分类中特征选择方法及分类器的组合进行了比较研究。......
潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一种流行的三层概率主题模型,其实现了文本与文本中的单词在主题层次上的聚......
近年来,Internet以及移动互联网技术的快速发展,使我们进入到了一个信息爆炸的时代。人们每天都在接受着来自社交网站、网络媒体的......
在电子商务平台,用户评论为用户提供了丰富的意见乃至购物导向,影响着用户的购物决策。而随着电子商务的发展和越来越多的用户参与......
伴随着中国经济的发展,金融市场与人们的生活越来越息息相关。研究表明突发金融信息会迅速给金融市场带来强烈扰动影响,而随着互联......
潜在狄利克雷分布(LDA)模型是主题挖掘领域的重要方法之一,为深入了解该领域的研究进展,对2012到2016年5年期间该模型相关研究成果进......
当前网络中充斥着大量的虚假评论,准确识别出代表用户真实感受的关键评论成为评论分析领域研究的热点问题。为此,提出一种基于回复......
为解决在社交网络平台中的用户内容个性化推荐问题,提出一种微博用户兴趣转移模型.用户的不同兴趣在其生 活以及社交网络平台中的......
为了对教学视频这一专门类别视频进行自动标注,本文首先提取视频中的字幕信息,通过文本预处理后,使用视频中的字幕文本信息内容结合潜......
众筹(Crowd-Funding)是指一种向大众募资,来支持个人或组织发起的项目的行为,具有低门槛、依靠大众力量、多样性、创新的特点。众......
SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题......