文本聚类算法在舆情监控中的应用分析

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:zhurichen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为满足网络舆情监控系统中话题发现的需要,并克服经典single-pass算法在处理网络文本聚类时受输入顺序及精度较低的不足,本文对single-pass聚类算法进行改进,通过采用average-1ink策略及引入"代"的思想分批聚类,在借鉴single-pass聚类方法简单高效的同时,又克服了其缺点,兼顾了网络话题发现的实时性和准确性,通过实验分析改进后的single-pass算法比single-pass算法在漏检率、误检率和耗时方面都有很大改观。实验证明改进的算法在提高话题发现准确度上的有效性和实用性。
其他文献
该文介绍了以单片机LM3S811为控制核心的智能电子秤设计,该电子秤可以实现基本的称重(称重范围为0~2.999kg,重量误差优于±5%)、显示购物清单的功能,并能对液态商品具有去
为解决龙门刨床拖动控制系统因负载变化或扰动出现时,传统调速系统不能达到预期效果等问题,将模糊PID控制技术运用到龙门刨床电力拖动调速系统中。文章介绍了模糊PID控制算法
介绍了一种电流互感器测试仪的设计方法,运用逆变器代替大功率升压变压器,给电流互感器加步进交流电压,运用双MCU方案来提高现有仪器的智能化程度。系统描述了该测试仪器的硬
针对罗氏有源电子互感器在现场运行中存在的电子回路易损坏、检修维护麻烦等问题,提出了罗氏无源支柱式电子式电流互感器的设计方案:将原置于高压侧的电子采集单元下放到互感
针对在电路测量中需要同时测量几处电压而没有足够的电压表、多点测量操作不便的问题,本文在利用虚拟仪器技术的基础上设计出了一种新型多路数字电压表。该多路虚拟数字电压
依据产业集群创新的相关要素,通过调研得到相关数据资料,运用实证分析的方法对珠江三角洲产业集群创新的现状、存在的问题进行了深入的分析,提出了有针对性的对策建议。
针对包含表情信息的静态图像,提出基于皮肤检测和SVM的人脸表情识别算法。首先根据先验知识,并使用皮肤检测和积分投影相结合定位眉毛眼睛区域和嘴巴区域,自动分割出表情子区
为在高线性的前提下提高WCDMA基站系统中功率放大器的效率,仿真设计了一款工作于2.14 GHz频段不对称功率驱动的Doherty功率放大器。基于ADS平台,采用MRF6S21140H LDMOS晶体管
针对目前变压器变比组别测试仪的检定工作中存在的问题,如变比检测时,预置变比值数量少,且检测小变比值时精度达不到要求,同时存在操作复杂,工作效率低等诸多不足之处,本文介