主题发现相关论文
各类信息系统每天产生大量富含文本及其链接数据的文档集合,对这些文档集合进行挖掘可快速对其整合。文档分类是文本挖掘的主要任......
【目的/意义】通过对微博数据的挖掘,了解公众的态度和需求,为新冠疫苗后续的推广或其他疫苗的推广提供一定的参考。【方法/过程】基......
大数据时代下我国关于档案服务创新的研究成果大量问世。本文基于数据挖掘技术进行我国档案服务创新相关文献的主题发现及演化研究......
“互联网+”让教育发生着深刻的变革,促进教育从封闭走向开放共享、从通用走向个性化、从单一评价走向综合评价。近几年来,在“互......
学位
主题模型是文本分析的一种有效技术,在舆情分析、问答系统、个性化推荐等领域得到了广泛应用。随着社交网络的快速发展,多样化的应......
文本在人类已产生的数据中占有极为重要的地位,如何从文本中自动发现知识是一个有着长久历史的经典问题。随着人工智能和数据科学......
随着Twitter、微博等在线社交媒体的快速发展,短文本已经成为互联网上常见的信息形式。由于社交媒体具有便捷性、灵活性、公共性等......
自动文摘是自然语言处理领域的一项重要的研究课题。作为解决目前信息过载问题的一种辅助手段,它能在一定程度上弥补传统的信息检......
互联网的快速发展催生了大量的文本数据,这些丰富的文本信息如何学习并进行有效表示成为了自然语言处理中的热点问题。词表示学习......
目前,存储库上可公开访问的科学工作流大量增加,这些科学工作流是科学家用来循环执行来实现某些功能的过程,它们由活动、活动之间......
随着互联网技术的高速发展,信息数量激增,因此科研人员需要花费更多的时间来寻求合适的合作者,这在一定程度上制约了科研工作者在......
在科技飞速发展的今日,科研合作范围和数字化文献的规模日益扩大。合著网络是一种基于作者协作关系的网络且表现出复杂网络具有的......
在网络舆情的传播过程中,舆情主题反映了舆情内容的变化情况,以主题为研究单元来研究网络舆情演化能深入揭示其演化规律。本文以微......
随着社交媒体和移动设备的日益普及,越来越多的人在社交平台对热点事件或特定商品发表自己的观点看法,随之而来的是带有情感信息的......
主题发现和演化一直是自然语言处理领域的研究热点。主题发现是指从大的语料库中抽取出关键词组,能够简洁地表示出这个语料库的概......
融入用户生成信息(User generated content,i.e.,UGC)的推荐系统在近年来得到了研究和应用。在众多的用户生成信息中,基于评分的反......
主题分析能够从文献中选择所有特征以及对重点主题内容进行分析,进而实现对文献的检索。也就是说,分析和把握文献内容是主题分析的......
随着信息技术的发展,尤其是因特网和大规模存储介质的普及,形成了信息的汪洋大海。因此,人们迫切需要寻找一条能够快速、准确获得所需......
[目的 /意义]分析中国国内基于主题模型的科技文献主题发现及演化研究进展,以期为相关研究人员提供参考借鉴及研究思路。[方法 /过......
[目的/意义]准确地计算微博相似度可以提高微博主题挖掘效率,对舆情治理、保障信息安全具有实践意义.针对微博文本语义稀疏、高维......
在综合实践活动实施的起始阶段,需要上“活动规划课”,其承载着主题发现、团队组建、方案制订等任务。引导学生制订可行的活动(研究)方......
复杂系统数据序列集未来行为的预测是一个难点,利用数据挖掘实现预测是有潜力的技术途径.针对包含多元时间序列和非时间序列的实时......
Stack Overflow是一个热门的国外编程问答网站,通过对该网站编程提问帖的问题文本进行文本语义挖掘,能获析用户关注的编程热点。由......
提出了一种自适应于不同题材文本自动确定其包含的潜在主题数K的方法.考虑到大多数文本的潜在主题分布符合段落密度特性,提出以段落......
通过对在线社交网络上图书馆用户生成内容(UGC)的分析,可以从宏观上更好地了解我国图书馆机构关注的热点话题及其演化情况。文章以新......
为了应对微信息舆情数据的格式复杂、价值稀疏和收集困难等大数据处理技术难题,基于隐含语义分析和粗糙集近似约简理论,设计微信息......
本文提出了一种基于改进HotRank算法的站点排序及种子URL选择方法,建立了在线主题发现系统信息采集自适应增量更新模型;结合LDA模......
互联网平台的蓬勃发展产生了以新兴媒体为承载的数字资源,如何从中有效实现知识检索、知识发现成为信息管理领域和互联网技术领域......
试图从另一个角度来考察主题提取算法HITS,即提出一种基于相似度的链接分析模型来观察主题提取的过程.通过给出一种一般化的相似度......
针对目前没有通用藏文搜索引擎的情况,提出一种基于领域本体的面向主题的藏文信息爬取策略。策略首先根据藏文和藏文编码的特点,判......
〔摘要〕在网络舆情内容的传播过程中,各种物理上独立的舆论会话在传播要素上可能存在着语义关联,并且传播要素之间的相互影响对舆情......
目前越来越多的机构建立微信公众平台,在公众号文章中的留言反映其受众在该文章话题下的关注热点和真实观点,因此分析和挖掘留言具有......
PLSA和LDA主题模型主要是研究纯文本内容。最近,开始提出用主题模型处理超文本,所提出的超文本模型是生成模型,引出了词和超链接的......
[摘要] 本文针对数据挖掘应用中分析主题确定问题,基于认知心理学中“概念”与“思维”的阐释,模拟人的思维过程,提出了一种思维(分析)主......
微博已经成为讨论社会热点事件的重要网络场所,对在海量微博文本中能有效挖掘出热点主题的研究是具有重要意义的。分析微博的数据特......
互联网群组是网络社群发展的最初形态,由多个具有相似认同感、共同爱好、相同兴趣的网络用户,通过群组聊天的形式聚集在一起形成。......
异构性、结构性和动态性是复杂社会网络的本质特征,研究网络的社团结构有助于发现复杂网络中的信息传播规律、热点话题和权威用户.......
为了深入探究网络舆情演化的特点与规律,需要在内容层面上有效地从网络舆情的大量数据中发现高价值的舆情主题,并结合时间维度将各......
自动发现话题的隐含结构、情感的极性及其关系,可以方便用户从海量网络评论集中快速获得他们关注的主要观点.提出一种基于非监督式......
针对已有的BBS论坛中有影响力主题计算方法的不足,提出了一种基于聚类分析的主题发现方法,其思想是借助潜在语义分析技术计算回帖之......
如何通过有效的数据挖掘对互联网教育平台中的课程主题进行挖掘、聚类是当前互联网教育亟待解决的问题之一。实验基于文本信息对某......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
时序是一种不同于其它类型的序列数据,它通过在离散的时间点取样形成。它在现实世界的许多领域广泛存在,例如:生物医学、金融、气象......
随着网络技术的迅速发展以及移动互联网的全面普及,以报纸、电视以及杂志等为代表的传统新闻媒体已经不能很好的满足受众者获取信......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......