基于增量式鲁棒非负矩阵分解的短文本在线聚类

来源 :电子学报 | 被引量 : 0次 | 上传用户:hellen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对社会化媒体产生的大量短文本进行聚类分析具有重要的应用价值,但短文本往往具有噪音数据多、增长迅速且数据量大的特点,导致现有相关算法难于有效处理.提出一种基于增量式鲁棒非负矩阵分解的短文本在线聚类算法 STOCIRNMF.STOCIRNMF基于非负矩阵分解构建短文本聚类模型,通过l2,1范数设计模型的优化求解目标函数提高鲁棒性,同时应用增量式迭代更新规则实现短文本的在线聚类.在搜狐新闻标题和微博短文本数据集上进行相关实验,结果表明 STOCIRNMF不仅比现有代表性算法具有更好的聚类性能,而且能够有效对微博
其他文献
据新华社电“乌合之众”这个成语是指像乌鸦那样聚集在一起的无组织无纪律的一群人。而日本一项最新研究却为乌鸦“正名”,研究人员发现乌鸦能够通过综合分析伙伴的声音与姿态
以下是10款风格各异的概念电脑设计,其中一些设计已经获得国际大奖。虽然有的设计现在看起来不切实际,但是我们很难否认,在多年后,它不会恰好成为未来笔记本市场的主流设计。    1.双显示器的MacBook  苹果一向能带给人惊喜,这款MacBook具有内外两个显示屏,都能进行触摸操作。  2.索尼Vaio Zoom笔记本  索尼的这款概念笔记本拥有一个全息玻璃屏幕,键盘则采用平面触摸式设计。开机后,
针对高速移动场景下信道快时变特性给多输入多输出(Multiple Input MultipleOutput,MIMO)系统预编码带来的技术挑战,提出基于动态信道状态信息(Channel StateInformation,CSI
3月19日上午,老科学家学术成长资料采集工程(以下简称采集工程)领导小组专家委员会第三次会议在中国科技会堂召开。中国科协常委、中国工程院院士、中国工程院原副院长、采集工
为贯彻落实内蒙古自治区万名党员干部“下基层办实事转作风”活动和巴彦淖尔市委号召全市党员干部“下基层到一线办实事转作风”活动电视电话动员会议精神,近日,内蒙古巴彦淖尔
企业的发展离不开经济的支持,而一个企业能否在市场浪潮中站稳脚步,完全依赖于企业的发展方向和资金的充足。企业要想发展壮大,就要管理好自己的资金流向问题,企业的财务管理
据国外媒体报道,对于天文爱好者们来说,这几天都将是观测夜空的好时机.太阳系的大行星们似乎正准备轮番上阵,给地球上的人们带来一场场视觉盛宴。就在上周一,火星抵达它两年多来距
新型教学理念倡导教学中增加师生交流互动环节,目的是通过加强交流,提高学生对于课堂的参与度与积极性,从而提高教学效率。与其他学科相比,高中语文教学需要更多的交流,这不
针对以相关谱最大值作为统计量对线性调频/二相编码(LFM/BPSK,Linear Frequency Modulation/Binary Phase Shift Keying)混合调制信号盲处理结果进行可信性检验时,存在概率密
在世界竞争日益激烈的今天,人才竞争是最为根本的竞争。构成人才的诸多要素中,道德素养始终居于首要地位。而且,我国自古就有'有德有才是圣人,有德无才是君子,有才无德是