文本聚类相关论文
习近平关于网络强国重要论述的基本内容体系大体可分为技术功能认知和国家建设方略两大层面,前者深入揭示了互联网的强国功能,包括互......
以百年未有之大变局下的大国博弈为切入点,立足未来航空科技发展的军事应用需要界定国防领域航空颠覆性技术的概念内涵,遴选适合国防......
现有的专利分析系统在可视化方面存在诸多不足,针对中文专利的可视化分析工具更是少之又少。结合文本挖掘技术,设计并实现“中文专利......
为了进一步弘扬丝路文化遗产价值,有必要对丝路文化遗产数据进行深入分析与探究。然而,目前丝路文化遗产数据呈现多源异构的特性,包括......
[目的/意义]识别和把握研究前沿具有现实价值,目前基础性知识工具中,主题模型因其独特的优越性而具有较为广泛的应用,为专家研判提供......
期刊
随着5G技术的出现以及计算机技术突飞猛进的发展,通过互联网发布和获取信息变得越来越容易。面对人工难以处理信息爆炸式增长的困......
学位
当前全球种业基本形成“两超、四强、差异化发展”新格局,种业巨头主导着全球作物育种技术研发和产业发展。通过深入分析和挖掘跨国......
服务质量中乘客感知的获取和满足是提高城市轨道交通吸引力的重要依据,评价过程的科学性与结果的准确性将对优化城市轨道交通的运营......
传统的文本聚类算法通过衡量文本间相似度对数据样本进行类簇划分,但无法根据用户给定的少量监督信息挖掘用户对聚类结果的主观意图......
近年来,随着高性能通信技术和工业互联网的快速发展,各行各业都将面临PB级别数据的处理。聚类分析作为数据挖掘中一种常用的无监督......
随着各个行业都开始进行业务的数字化转型,测试作为软件生命周期中非常重要的一环,具有不可或缺的作用,但为了解决成本高、测试人......
事件抽取目的是检测文档和信息流中是否存在事件,并以结构化的方式展示事件信息。其研究任务包括辨别事件类型、抽取事件参数,以及......
文本聚类能在大量复杂的文本中精确有效地挖掘有用的信息,因此成为信息处理领域的一个研究热点。随着神经网络在自然语言处理领域研......
新闻是人们获取资讯的重要渠道,在互联网技术高度发达的今天,人们通常通过新闻app和新闻网站获取新闻,在海量的信息流中,人们对于......
2019新冠肺炎疫情爆发以来,中国人民在中国共产党的领导下,万众一心,全力抗击疫情。从2019年12月底至2020年4月初,在经历了几个阶......
针对文本聚类时文本特征维度高,忽略文档词排列顺序和语义等问题,本文提出了一种基于句向量(Doc2vec)和卷积神经网络(Convolutional Neu......
随着互联网的普及和电子商务的推广,越来越多的消费者选择网上购物。而在线评论与商家的回复可以帮助消费者了解更多关于商家和商......
快速准确的在海量网络数据中发现热点主题对于网络舆情监控具有重要作用.针对K-means算法对初始中心点选择敏感和全局搜索能力不足......
舆情是社会民意的集中反映。网络舆情来源广泛,传播速度快,且海量多样。为了帮助政府机构、社会媒体能够在海量舆情文本中更有效率......
现有的文本聚类算法存在划分不准确以及同名消歧算法的冷启动性等问题。针对这些问题,本文融合多种特征提取算法提出了基于Word2ve......
随着互联网的发展,文本数据的激增,自然语言处理领域得到了良好的发展。在自然语言处理领域中,自动文本摘要生成技术是一个重要的......
随着数据爆炸时代的到来,如何高效快捷地挖掘出冗余数据中有价值的信息变得越来越重要。聚类分析是一种无标签、无监督学习的数据......
在大数据环境下,从海量的互联网数据中获取热点话题是研究当前互联网中民意民情的基础,其中文本聚类是得到热点话题最常用的方法之......
随着信息技术的发展,互联网中涌现出了海量的文本数据,如何从这些文本数据中挖掘有价值的主题信息是文本挖掘领域中重要的研究内容......
随着信息化时代的到来,新浪微博变为超大型的社交平台,引导着网络舆论的发展方向。如何从评论中获取有效信息和情感取向,以及掌握舆论......
随着计算机行业的快速发展,人们获得的信息和采集的数据不断增加。聚类算法作为数据挖掘的一种常用工具,可以有效地分析数据之间的......
为了提高文本聚类的性能,采用k-modes算法进行文本聚类,并采用知识图谱进行样本预分析,以提高k-modes的文本聚类适用度.采用知识图......
社交媒体是互联网上基于用户关系的内容生产与交换平台。近几年社交媒体的迅速扩张使人们可以实时便利地了解世界上正在发生的事情......
针对文本信息特征冗余多、噪声大问题,提出基于和声搜索机制的文本特征选择算法.以词频逆文本频率指数为目标函数评估特征词条;在......
灾害期间的舆情引导有助于维护社会稳定.社交媒体是舆论传播的重要渠道,通过微博评论了解用户的网络情感及关注的话题,可以帮助相......
K-means算法是进行文本聚类时使用最为广泛的一种推荐算法之一。该算法在进行文本聚类时每个属性的作用是同等的,而实际中每个属性......
随着信息技术的飞速增长,网络全球化给人们带来的好处也愈加丰富,大量的英文文本携带着众多重要信息出现在种类繁多的资源当中,这......
文本在人类已产生的数据中占有极为重要的地位,如何从文本中自动发现知识是一个有着长久历史的经典问题。随着人工智能和数据科学......
计算机技术快速发展,海量的数据信息加速传播,这些数据是富有很多附加意义的,数据主要的存在方式是以文本的方式存在。现在,很多研......
随着互联网科技的迅猛发展,网民数量和上网时长日益增加,特别是“互联网+”战略的推进,互联网已日益成为公众日常工作、生活、学习......
目前,网络平台层出不穷,用户量和信息量都呈现爆炸式增长。网络平台门槛低、管理宽松,给垃圾用户的出现创造了有利的条件。平台中......
[目的 /意义]网络用户在线评论是用户对某产品或服务机构体验感知的反馈,对网络用户在线评论的文本挖掘是情报分析的重要内容.[方......
网络舆情热点发现是一种常用且处理速度要求较高的应用.针对网络舆情热点发现这一特殊应用场合,本文提出了一种基于随机N-Gram的文......
伴随着互联网技术的发展,文本数量的爆发式增长带来了处理文本数据的一些困扰,传统的文本聚类以及关键词提取的技术不能很好解决对......
微博由于其内容传播速度的即时性和传播范围的广泛性积累了大量的用户,成为了热点事件的舆论爆发地与传播地。对于微博的某个突发......
关键词对于文本聚类/分类、信息检索等任务都具有非常重要的意义。然而,其自动标引技术的实现离不开知识库的支持。本文首先列出了......
随着互联网的快速发展,网络舆情分析研究变得越来越重要.其中聚类是网络舆情分析中的一个非常重要的方法.传统的聚类算法都是基于......
文本分类是信息检索的一个重要问题,而文本-词频矩阵的词频维数过大和过于稀疏两个特点,给计算造成了相当困难.为解决这一问题,本......
文本聚类是目前文本挖掘中重要的探索性数据分析方法.一篇文档仅属于某个主题,是很不现实的,所以模糊文本聚类比一般的硬文本聚类......
针对科研入员不便在庞大数量级的科研项目中手动寻找合作者的现状,基于关键词提取、文本聚类、语义相似度度量等技术,提出了一种科......
文本聚类大多采用TF-IDF方法把文本建模为词频向量,利用余弦等相似度量方法计算文本之间的相似度,以此进行文本聚类.这些方法忽略了......