潜在狄利克雷分布相关论文
近年来,随着网络攻击的发展变化,网络空间安全形势也越来越严峻。高级持续性威胁(Advanced Persistent Threat,APT)攻击作为目前发展......
潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一种流行的主题模型算法。它对每篇文本以及文本中每个单词进行主题层次上的聚......
互联网领域技术高速发展,产生了大量的网络数据,用户迫切需要以较快较准确的方法获取文本的核心信息,而搜索引擎给出的信息依然过多、......
随着计算机技术的不断进步,人类创造的数据正以爆炸式的速度增长,传统的集中式的信息检索在面对海量数据时往往不堪重负,分布式的信息......
课堂话语作为课堂教学的重要媒介和主要手段,也是判断教师自身专业素质、教学理念和教学效果的重要指标之一。采用图式化和量化的......
铁路扣件是连接钢轨和轨枕的重要基础部件。传统的扣件检测依靠人工巡检,缺乏准确性和实时性。近年来,计算机视觉技术的高速发展为实......
图像的自动标注技术和基于语义的图像检索技术在多媒体信息检索领域有着重要的地位。图像标注满足了用户在海量图像数据库中进行关......
针对微博热点话题检测使用主题模型只能提取出无序话题词组合的问题,提出一种结合词激活力模型与主题模型各自优点的微博热点话题......
潜在狄利克雷分布(LDA)以词袋(bag of words,BOW)模型为基础,简化了建模的复杂度,但使得主题的语义连贯性较差,文档表征能力不强。......
针对传统"视觉词包(BOW)模型"识别铁路扣件状态时仅利用扣件图像的特征域,忽略其空间域中上下文语义信息的缺点,提出了一种基于上......
随着社交网络的不断发展,微博成为越来越多的人获取信息的平台。为了有效解决微博话题检测中海量短文本带来的词稀疏问题,提出结合......
分层分布式狄利克雷分布(HD-LDA)算法是一个对潜在狄利克雷分布(LDA)进行改进的基于概率增长模型的文本分类算法,与只能在单机上运......
针对口语对话系统领域分类任务中传统领域分类方法如SVM需要进行大量人工标注的问题,将LDA(Latent Dirichlet Allocation)模型应用......
[目的/意义]使用融合多属性的量化方法,快速且有效地挖掘出领域内多个技术创新主题,为技术创新方向的确定提供借鉴。[方法/过程]将......
当今的社交网络拥有庞大的用户数量和随之而来的海量信息,可以为工业界各个领域的研究提供重要的数据补充。其中,如何高效准确地对网......
潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一种流行的概率主题模型,能够从大量的非结构化文档集合中抽取出隐含的语义......
实体链接任务主要包括命名实体识别、查询扩展、候选实体选择、特征抽取和排序。本文针对查询词的扩展,提出了一种基于词向量的扩展......
针对传统"视觉词包模型"在进行底层特征编码时存在较大的量化误差的问题,提出一种基于近义词分配的铁路扣件状态检测模型。首先,利用......
极光是发生在地球南北极高空的一种大规模放电现象,蕴含着丰富的物理意义,研究极光的产生机制有助于深入探讨地球磁层的变化规律和......
改革开放以来,随着国内经济快速发展,国际地位不断提升,城市功能日益完善,越来越多的大型活动开始登陆大中等城市。大型活动客流总......
短文本一般具有篇幅较短、特征稀疏、信息量不明显等特性,直接使用传统的文本分类方法进行分类的效果一般不理想。潜在狄利克雷分......
针对LDA主题模型用于产品特征抽取中存在的问题,提出将句法分析和主题模型相结合的SA-LDA方法。首先基于句法分析对产品所在类别下......
为了提高文本相似度检测算法的准确度,提出一种结合潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)与Doc2Vec模型的文本相似......
针对潜在狄利克雷分布(LDA)模型忽略特征单词明确性的问题,提出一种嵌入标记信息的主题模型WL_LDA。设计一种基于SIFT特征点约束单......
随着现代信息技术的迅猛发展,Web2.0时代开启了人类史上真正有意义的互联网在线学习之旅。信息运行载体和传播形态的改变导致学习......
社交网络尤其是微博中含有大量的短文本。短文本不同于传统的文本,其携带的语义特征信息密度低,很难对其进行准确的主题挖掘。针对......
期刊
卷积神经网络(Convolutional Neural Network, CNN)在图像视频分析中比传统方法有更高的准确率和快速的处理速度,利用CNN进行视频......
潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一种流行的三层概率主题模型,其实现了文本与文本中的单词在主题层次上的聚......
随着旅游市场的快速发展,人们对智能旅游服务的需求大幅增长。互联网的普及使每个人都能很轻易地从各种旅游网站获取相关资讯。然......
近年来,Internet以及移动互联网技术的快速发展,使我们进入到了一个信息爆炸的时代。人们每天都在接受着来自社交网站、网络媒体的......
伴随着中国经济的发展,金融市场与人们的生活越来越息息相关。研究表明突发金融信息会迅速给金融市场带来强烈扰动影响,而随着互联......
潜在狄利克雷分布(LDA)模型是主题挖掘领域的重要方法之一,为深入了解该领域的研究进展,对2012到2016年5年期间该模型相关研究成果进......
当前网络中充斥着大量的虚假评论,准确识别出代表用户真实感受的关键评论成为评论分析领域研究的热点问题。为此,提出一种基于回复......
为解决在社交网络平台中的用户内容个性化推荐问题,提出一种微博用户兴趣转移模型.用户的不同兴趣在其生 活以及社交网络平台中的......
为了对教学视频这一专门类别视频进行自动标注,本文首先提取视频中的字幕信息,通过文本预处理后,使用视频中的字幕文本信息内容结合潜......
众筹(Crowd-Funding)是指一种向大众募资,来支持个人或组织发起的项目的行为,具有低门槛、依靠大众力量、多样性、创新的特点。众......
SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题......
为了挖掘海量微博数据中潜在的语意信息,通过Gibbs采样方式,并结合Spark分布式计算框架,实现了一种LDA主题模型并行化的算法。该算......
传统情感模型在分析商品评论中的用户情感时面临两个主要问题:1)缺乏针对产品属性的细粒度情感分析;2)自动提取的产品属性其数量须......
随着近几年微博、博客、电子商务网站的兴起,用户的参与度和活跃度越来越高,针对热销商品、热门新闻事件等产生了海量的评论信息。......
针对情感分析需要大量人工标注语料的难点,提出了一种面向无指导情感分析的层次性生成模型。该模型将朴素贝叶斯(NB)模型和潜在狄......
2008年金融海啸发生后,金融风险问题开始日渐引起管理机构及学者的重视。近年来,随着社交网络的飞速发展,突发性金融信息会在短时间内......
传统的搜索引擎仅返回给用户包含查询关键字的文档,忽略了查询背后用户真正的信息需求。为此,将文档检索看作个性化推荐问题,提出一种......