主题建模相关论文
为了探究西方社交媒体对中美贸易战的态度及关注焦点,本文爬取了贸易战期间Twitter上相关的热门英文推文,对其进行了情感倾向分析和......
自然语言处理(NLP)是计算机科学中一项充满挑战性的研究,广泛应用于文本挖掘领域。通过对人类语言处理过程,它能使计算机理解文本文......
当今的互联网时代,信息技术在快速迭代,推荐系统致力于帮助人们解决信息过载等问题,提高信息处理的效率的同时,也存在一些既定的问......
科学教育是建设创新型国家以及呼应科教强国政策的根本,对于科技创新人才的培养至关重要.美国国家科学教学研究学会的年会代表了全......
本文针对在线评论社区自媒体影响力增加,带来的众包活动恶意影响舆论与竞争对手口碑的场景,提出了一种端到端的中文评论自动化众包......
[目的/意义]通过分析近年来我国图书馆法律法规的内容特征及其发展脉络,探究其发展趋势,为我国图书馆法律法规研究提供借鉴,为图书......
科学文献是科研人员通过实验对自然科学现象进行充分观察或研究后,对成果与结论的书面表达。海量科学文献的发表使科学的结构不断......
通过对我国图书馆事业发展策略主题发现及演化分析,可以掌握图书馆事业发展过程中相关文件的制定和实施情况,客观认识和评价图书馆......
随着在线社交网络的日益普及与流行,越来越多的用户通过社交网络平台发布信息、分享生活状态及搜索自己感兴趣的话题。在线社交网......
[目的 /意义]探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势.[方法/过程]提出一种融合词向量语义增强和DTM模......
本文将基于临时子文档框架的隐式分配(LDA)分割与传统聚类方法(如基于分段的聚类)进行比较,以实现有效的文档聚类。文档聚类被用于主题......
个性化的推荐系统可以精准地为用户提供其感兴趣的结果.但是,酒店是一类特殊的商品,个体对其的偏好差异较大,简单的用户星级评分机......
针对文本数据非结构化、数据量大、高维稀疏性、蕴含语义情感,无法利用现有数据挖掘技术直接对其进行分析的问题,设计并实现了对文......
概率主题建模是发现数据中隐藏的主题结构的一类方法。在概率主题建模中引入数据本身具有的标注信息,将无监督概率主题建模拓展成为......
离散属性数据是数据挖掘中的一类重要数据,而非监督学习,是数据挖掘采用的一类关键方法。本文针对多种类型的离散数据,包括文本数据,时......
多媒体技术以及网络技术的迅速发展,使得人们拥有和面对的多媒体信息的数据量急剧增多。伴随着近年来移动互联网的迅猛崛起,大数据时......
代码复用是一种重要的软件复用方式。复用者需要理解软件代码实现的功能。近些年,如何辅助复用者理解代码功能成为了软件复用的研究......
大数据时代数据的爆炸式增长,为人们发现隐藏在海量数据中的知识,实现数据驱动的科学决策提供了宝贵机会。文本数据作为广泛存在的一......
随着互联网的高速发展,网络中的信息量呈爆炸式增长,互联网已经成为人们获取信息的最主要渠道之一。作为信息检索过程中不可缺少的......
如今,用户交互式问答社区已成为网上信息获取和知识分享的重要媒介。诸如Yahoo! Answers、百度知道等问答社区网站每天发布有数以......
随着互联网的发展,网络上的数据日益增长,其中带有地理信息的互联网数据越来越多,传统的主题建模算法只能利用文档的单词信息,丢弃......
网络的发展带来了前所未有的技术革新,而作为一种社交媒体,网络论坛正在成为人们日常交流的重要工具。在网络论坛中,用户通过自己......
当下,我们生活在一个信息爆炸式增长的时代。为了缓解人们面临的“信息过载”问题,推荐技术应运而生。推荐技术旨在利用用户的兴趣信......
随着互联网的快速发展,网络评论呈现出爆炸式增长的趋势,已经成为挖掘消费者对产品或服务情感倾向的一个极具价值的资源。网络评论......
随着社交网络的迅速扩张,旨在为社交网络用户提供信息推荐的社会化推荐系统逐渐得到研究和发展。在实际应用中,社交网络用户对信息......
随着Web应用的蓬勃发展,现实世界中存在大量的对象,它们相互之间存在各种各样的交互关系,形成一个庞大的、相互联系的复杂网络,我......
摘 要:教育数据的海量爆发和流通、大数据技术的逐步完善,促使教育数据的应用从零星走向整体、从人工迈向智能。对教育数据进行有效......
为了躲过学术不端检测,剽窃者们通常都不整段的复制粘贴,而是通过较智能的替换词语、调整语序、调整篇章结构等行为来进行剽窃或者......
近年来,短文本已成为互联网信息的普遍形式,尤其是随着在线社交媒体的发展,其数百万的用户每天都会生成大量的短消息。从大量的短......
App商店的存在为App产品的开发提供了快速增长且规模巨大的数据资源,如何依据开发者需求智能化地挖掘并使用其中信息是目前的热点......
本文基于新闻具有生命周期较短、访问记录稀疏、文本表示复杂的特点,构造了一个基于主题建模和分层隐变量模型的新闻推荐系统。此......
现有主题建模方法难以对复杂的文本信息进行有效的表示和利用,导致无法提取深层次的语义信息。特别是短文本数据由于存在特征稀疏......
随着移动互联网的快速发展,尤其是如社交媒体,即时通讯等平台的发展,人们在网络上传递观点,分享信息,发布新闻,从而快速产生了大量......
当今互联网的高速发展,催生了众多的网络应用,同时高速的网络发展带来巨大的新闻数据量。与此同时,大数据量也给政府组织及其其他......
信息化是信息技术和信息资源与国家社会、经济、文化等综合发展高度集成的发展模式,是20世纪90年代兴起的全球性社会变革浪潮。信......
随着在线社交媒体和电商的快速增长,诸如微博、朋友圈、以及商品评论等在线应用创造了大量的短文本,但如何高效地挖掘短文本中有价......
基于从中国知网获取的1259篇2000—2020年以“航海教育”为主题的期刊论文,使用卡方检验算法进行阶段性文本特征词比较分析,使用结......
关键词:冠状病毒;主题建模;网络分析:历时性分析 2020年,突如其来的新冠病毒(COVID-19)席卷全球,对全球经济和社会发展带来了巨大挑战......
科学教育是建设创新型国家以及呼应科教强国政策的根本,对于科技创新人才的培养至关重要.美国国家科学教学研究学会的年会代表了全......
社交化编码是当前软件开发生产的一个重要方式,其开发模式的灵活性与开放性吸引了大量的开发者.开发者通过参与开源项目能够提升自......
随着信息技术发展,通过访问内容去审查用户网络访问行为的应用问题逐渐成为备受关注的一项数据建模应用问题。现有的主题模型能够从......
[目的/意义]针对专利文本主题建模中领域停用词自动选取尚未有充分研究的问题,提出一种新的领域停用词自动选取方法,用于专利文本......
目的基于主题建模和情感分析的方法,在患者医疗服务投诉文本中挖掘有价值的主题信息和情感分布,调查影响患者服务体验和满意度的主要......
科学教育是建设创新型国家以及呼应科教强国政策的根本,对于科技创新人才的培养至关重要。美国国家科学教学研究学会的年会代表了......
针对协同过滤推荐中由于项目和用户间关联因素的相互影响而存在项目偏差和用户偏好的问题,提出一种融合项目偏差与用户偏好的推荐......
基于警务战术研究平台数据仓库的三大功能需求:案件查询、可防性形势分析、实战决策分析,笔者深入分析探讨建立警务战术数据仓库的......
基金项目与科学研究的多维度关联影响分析能够提供细粒度洞察,有助于国家科学战略的科学规划及科技策略制定。本文结合国家自然科......