基于词频统计的文本可视化实现

来源 :软件 | 被引量 : 0次 | 上传用户:hzq5157585
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着海量文本的涌现,信息超载和信息提取速度慢等问题促使了文本可视化技术的出现。文本可视化通过对文本资源的分析,提取信息,并以图形化方式呈现出来,为人们提供了一种快速获取文本关键信息的有效手段。在介绍了文本可视化的概念和重要性的基础上,着重阐述了基于词频统计的中文文本可视化的实现方法。基于某微博账户的微博数据,首先使用TF-IDF算法进行关键词提取,得到带有权重的词语,然后基于SVG技术和四叉树算法,实现了文本布局算法。最后得到的可视化效果良好,能全面、直观地反映出用户的兴趣和关注点。
其他文献
风电场配置动态无功补偿装置可以有效提升风电汇集地区无功电压控制水平,但实际运行中,无功补偿装置存在运行可靠性差、动态响应时间不满足要求等问题,未能有效发挥其动态无功支
本文以大连理工大学为例,从政策、管理、服务的角度对“互联网+服务”下高校因公临时出国(境)管理信息系统建设的背景、建设的基础进行介绍,展示系统应用的初步成效。
从互联网+时代对企业产品数据管理需求不断升级的现状出发,针对数据挖掘中经典的关联规则算法-Apriori算法中存在的不足并考虑到不同企业PDM系统中存在的企业文化、操作习惯不
以单相并网系统为研究对象,对光伏并网系统进行了全面的理论分析,选择适合其特点的逆变主电路拓扑结构,全面分析全桥逆变电路的工作原理,给出主电路直流侧和交流侧滤波器的设
2017年是大气十条收官之年,北京能否达到大气十条的目标.取决于今年秋冬季的雾霾应对情况。为此.环保部近日联合10部委以及京津冀晋鲁豫六省市出台“1+6”方案强力治霾。力度和
本文主要就向量地址平均长度问题进行建模与仿真。向量网很好地解决了IP网络地址枯竭的问题,但由于向量地址是不定长的,因此对向量地址平均长度的研究成为评价向量网效率的一
突发性耳聋是耳鼻咽喉科的常见急症之一,近几年呈现发病逐年增多的趋势。患者主要表现为无明显诱因突然出现的感音神经性耳聋,多为单耳发病,且发病急骤,患者的听力一般在数分
光学传递函数OTF能客观、定量地衡量光学系统的成像质量;是评价光学系统的重要指标。本文给出的一种方法,从系统的光瞳函数出发,胜自相关函数法计算光学传递函数。并列举了一个计算