一种运用相容语义块约简的网络话题检测方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:pikaqiuqqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对已有基于词聚类的话题检测方法存在的缺点,本文利用网络文档的半结构化特征提供的语义信息以及利用词在语义上下文的共现频率定义词之间的语义相似度,然后构建文档集的词共现语义网络,实现词之间语义关联的建模;据此提出相容语义块的概念,并通过对相容语义块的构建、分裂和约简来实现对话题的检测,进而提出一种基于相容语义块约简的网络话题检测方法.该方法获得的结果稳定,表现话题的词集简短而富有表达力,因而十分适合于网络话题检测,实验亦说明它的这些优点以及它的有效性和可行性.
其他文献
类风湿关节炎(RA)是一种以关节滑膜炎为特征,以慢性多发性关节炎为主要临床表现的一种全身免疫性疾病.现对RA免疫学的抗原抗体检测作一综述.
神经病学是研究神经系统疾病的临床医学学科.由于青年教师教学经验少,讲授神经病学课程有一定困难.本文就神经病学课前准备、课堂教学方法、多媒体应用及课后总结等方面存在
流形学习算法分为两类,一类是等距映射算法,一类是等角映射算法,它们都有各自适用的数据类型.现有的流形学习算法都是直接处理流形数据,不对数据集作数据类型判定,使得算法在
Web服务的自包含、自描述和模块化的特性使之迅速受到工业界和学术界的极大关注,其中,服务组合是研究的热点和难点.然而Web服务的海量性、服务描述的异构性以及服务的动态变
在深入分析各种空间连接算法特点的基础上,提出一种可以有效提高多路空间连接效率的优化方法.该方法一方面针对空间数据的聚类特性,提出了获得更加紧凑的R树索引结构的算法;另
随着网络速率的不断提升,网络安全系统对于数据包内容的实时检测变得越发困难,基于零拷贝思想和多核技术设计实现了一种高速报文内容检测系统,系统采用零拷贝的思想消除数据
抗磷脂综合征是一种累及多器官的系统性自身免疫性疾病,临床以反复发作的动静脉血栓形成、自发性流产、血小板减少以及持续的血清抗磷脂抗体阳性为主要特征.神经系统的受累是
传统的协同过滤推荐算法大部分只考虑单一的用户相似度,而忽略了用户其他特征,随着Web2.0和社交网络等互联网新概念模式的发展,用户对个性化推荐技术的要求越来越高.针对上述
面向流数据的传统聚类算法主要有3个方面的不足,一是对流数据不断进入的动态环境不太适应;二是其微簇半径不能随流数据分布的密度变化进行相应的伸缩;三是其聚类阈值严重依赖人
针对云存储中数据完整性检查的问题提出一种高效的动态数据持有性证明方案.数据所有者(Owner)利用哈希一异或运算预先生成一定量的验证标签,并将其加密后与数据一起存储在服