基于语义概念的海量短信文本聚类

来源 :计算机工程 | 被引量 : 0次 | 上传用户:xaly001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于语义概念的海量中文短信文本聚类方法。该方法从短信文本出发,利用《现代汉语语义分类词典》的级类主题词,在短信文本向量集中提取概念元组,形成表示聚类结果的高层概念,基于这些高层概念进行样本划分,从而完成整个聚类过程。实验结果表明,该聚类算法有较好的聚类结果且执行效率较高。
其他文献
管海明提出的保形迭代函数构造方法(武汉大学学报:理学版,2008年第5期)在实际应用中不能顺利求得迭代大整数次的结果。针对该问题,结合离散对数问题的应用方法,提出2个解决策略,利用
树立正确的教育理念,提高自身素质,协调好与年级主任的关系,做好新生入学教育工作,加强学生日常学习生活的管理工作,加强就业指导,是做好一名兼职班主任的基础。
摘要:语文教学要培养学生的创新精神,发展他们的创新能力,必须充分关爱孩子的生命活动,追求富于“灵性”的教育,实施“性由天成,促其发展”的教学策略,现在实施的素质教育,大力提倡培养学生的创新能力,应该充分开发孩子的“灵性”。  关键词:激发灵性 开发灵性 启发灵性  一、优化教学语言,激发学生好奇的灵性  教师的语言,在一节课中起着极其重要的作用。学习一篇课文,优美动听的导入语能引发学生的学习兴趣,
近年来,我国金融业发展迅速,竞争环境日趋激烈。在这种大环境下,银行业要通过何种途径来实现管理当中的转型和改革已经成为近年来人们关注的热点,这也是各银行想要脱颖而出的必要
现有无线射频识别(RFID)群证明方案中的群证明生成效率较低。针对该问题,基于椭圆曲线离散对数困难性问题,采用多重签名的思想,并行且匿名地生成群证明。理论分析结果表明,该方案满足安全性和隐私性要求,与同类方案相比,只需一次点乘即可生成群证明,效率更高。
高中英语教学中普遍存在阅读与写作训练的问题。本文针对这个问题,通过笔者对多年教学实践的提炼.探索了“阅读积累、吸收模仿、话题拓展、任务写作”等以读助写.提高高中生英语
按照NY/T 1377-2007《土壤pH的测定》进行测定,为了评估土壤pH值测定的不确定度,主要研究了测定的重复性、土样质量、水的体积、缓冲溶液和pH计所带来的不确定度,经计算得知,
在数据挖掘的关联规则挖掘算法中,传统的频繁模式挖掘算法需要用户指定项集的最小支持度。引入Top—k模式挖掘概念的改进算法虽然无需指定最小支持度,但仍需指定闽值k。针对上
为快速、高效地校正具有径向畸变的鱼眼图像,提出一种基于几何性质的校正算法。根据投影不变性原理以及径向畸变的几何特性,计算畸变直线的斜率,并通过求解线性方程组得出多项式校正模型的参数。实验结果表明,该算法能够以较低的运算复杂度获得较高的校正精度,相比于采用数学迭代拟合直线的方法,该算法在图像整体校正质量上有明显改善。
我国现行刑法下的洗钱罪存在缺陷,应该重新界定洗钱犯罪的概念。具体讲,洗钱犯罪的客体是司法机关的正常活动;客观行为必须体现实行行为的特征;其主体是包括上游犯罪行为人在