推特多维事件信息可视化方法研究及系统实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:fallleaf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展和移动通信技术应用的空前繁荣,社交媒体成为社会生活中人们获取和分享信息的重要工具,用户越来越喜欢在社交网络上发表言论和观点。社交媒体也得益于用户量的增长,从而在很多重要的传统领域发挥着极为重要的作用。推特在政治活动、自然灾害等重大事件发挥的重要传播作用使得针对社交网络的事件检测和事件可视化工作受到了极大的重视。  推特事件可视化是指将事件在图形界面中进行展示,并提供相应的事件信息的过程。在事件信息中,地理位置对用户评估事件影响、感知事件发展具有十分重要的作用,因此对事件发生的地理位置进行识别是对事件进行可视化的前提条件。多连词是指表示完整的人名、地名等实体的名词词组。统计发现有超过一半的地名是多连词,为了对事件进行准确定位,需要对多连词进行识别。本文以推特短文本为研究对象,重点研究了推特短文本的多连词识别技术、事件定位技术和事件信息可视化方法。本文主要在以下几方面进行了创新设计与实现工作:  (1)提出基于无监督学习的多连词识别方法。为了实现多连词识别,又提出一种基于模式匹配的推文预处理方法,通过匹配特征对推文进行规范化和分词。以预处理为基础,使用一种无监督的多连词识别方法,在无标注的推文集合中提取多连词信息,结合正规文本的多连词特征,训练多连词列表,进行多连词识别。在实际推文训练和测试中,相比于传统的多连词识别方法,本方法随着处理推文数量增加,可以显著提高多连词识别的准确率。  (2)提出基于最大熵模型的推特事件定位方法。本方法对最大熵模型的特征模板进行改进,结合多种语义信息进行特征构建,使用词性标注和实体标注后的训练集对最大熵模型进行二分类训练,从而识别文本中的地理名词。在此基础上提出了基于位置信息的加权定位算法,根据文本地理位置、用户位置和发推位置对推特事件进行定位。本方法提高了推文地名识别准确率和召回率,同时,事件定位算法能够高效准确的对事件进行定位。  (3)设计实现了一套地理信息融合的事件可视化系统。本系统基于推特事件的地理位置进行信息可视化系统的构建,实现了对事件的预处理、定位和实时可视化功能。系统以地理位置信息为基础,结合电子地图对事件信息进行展示。在实际测试中,系统能稳定完成可视化工作。
其他文献
近年来,国家提出了“智能电网”计划,加快了国家电力系统的建设步伐。变电站作为电力系统变配电功能单位,监测其各种参数有助于供电部门及时了解变电站的运行和用户用电情况。而
随着现代灯光控制技术的发展,智能调光技术成为灯光控制领域的研究热点。DMX512协议规范了整个灯光控制市场,开辟了调光网络协议的先河。智能楼宇的崛起和发展,促进了智能调光技
智能天线原名自适应天线阵列(AAA, Adaptive Antenna Array),最开始应用于军帮、声纳、雷达、通信等方而,主要用来完成定位和空间滤波。智能天线足移动通信研究人员把自适应天
无线传感器网络中节点的能量主要由电池提供,当电源能量损耗完,节点将无法完成工作。为了尽可能的节约能耗。在硬件方案的提出中,必须采用低能耗设备,而软件方面,通过各层信息协议
为了满足下一代无线移动宽带业务需求,3GPP(3rd GenerationPartnership Project)启动了LTE(LongTerm Evolution)研究项目。作为LTE物理层关键技术之一的OFDM(Orthogonal Frequency
未来无线网络的一个显著特征是异构无线网络的融合。不同的无线接入技术提供不同的覆盖范围、移动性支持、系统容量和服务质量等,如何有效地管理和利用异构无线网络的资源,挖掘
在机载对地观测领域,装载于低空、小型无人机平台,飞行高度低、观测距离近的合成孔径雷达(Synthetic Aperture Radar,SAR)受到广泛关注。它要求雷达体积小、重量轻、成本低、功耗
地震勘探的最终目的是得到地下介质分布情况,全波形反演(FullWaveformInversion,FWI)可以更精准的获得地下介质的参数如速度、密度等,但是实际资料处理中存在大量干扰,这会影响全
超宽带技术(Ultra-wideband,UWB)由于传输速率高、功耗低、成本低、抗多径能力强等优点,近年来受到业界广泛的关注。IEEE标准化组织已经将超宽带无线通信技术作为高速无线个域网