中文文本聚类相关论文
随着中国人口老龄化进程的不断加快,老龄患者对医疗的需求正在不断上升,相对应的高龄手术例数也呈逐年上升趋势,虽然当今医疗水平......
随着信息处理技术的快速发展,文本聚类作为一种高智能的文本信息处理方式越来越引起人们的注意。特征提取是文本聚类中的关键一环,只......
随着信息产业特别是互联网的高速发展,人们可以很容易得从互联网、数字图书馆以及公司内部网络获得海量的数据。这些数据按照其组织......
随着信息技术的发展,以电子形式存在的文本信息已经成为人们主要的信息来源。人们迫切需要能够快速、有效地发现资源和知识的工具......
随着互联网的普及,网页上的文本信息呈现出爆炸式增长的趋势。如何索引,检索,管理,挖掘网页上的海量文本信息已经成为计算科学领域......
聚类作为一种知识发现的重要方法,它广泛地与中文信息处理技术相结合,应用于网络信息处理中以满足用户快捷地从互联网获得自己需要......
在提出了将STC应用到中文文本聚类上的算法的基础上,设计并实现了一个中文文本聚类系统,通过实验验证得出结论:从时间复杂度和查准......
本文提出了一种中文文本聚类的方法,并将其用于互联网搜索结果的文本分类上。实验证明,该方法在一定程度上,根据语义,较好地对搜索结果......
本文对字、词和字串等文本特征在中文文本聚类中的效果进行了比较实验.实验使用K-MEANS聚类方法,检验了字特征、字串特征、词特征......
特征选择是文本聚类的重要环节,传统的阈值截断特征选择方法偏重高权重项,受特征词权重计算公式影响较大.遗传算法具有全局搜索的......
针对互联网舆情管控领域信息量大,时效性强,往往偏重于某些方向,如社会热点、焦点,或反动、黄色言论等的特点,文中把基于密度的聚类思想......
摘要:传统的中文文本聚类方法需要将半结构化或非结构化的数据构建数学模型,一般情况下都要进行降维处理,这些操作均会带来一定失真,影......
随着我国互联网的迅速发展,网络上涌现出大量的中文文本信息。面对海量的中文文本信息,如何快速的找到需要的信息是一个迫切的问题......
为改进已有中文文本聚类中数据非结构化导致的算法准确度不高及特征向量高维稀疏导致算法复杂度过高的现状,提出一种基于深度词汇......
近年来,我们可以很容易地从Internet、数字图书馆、新闻机构和公司内部网上获得数目惊人的文本文档。于是,人们对发展能够帮助用户有......
文本聚类是数据挖掘领域中的一个十分重要的分支。文本聚类技术能够有效的将网页上的文本信息进行归类,方便人们在海量的网络信息......
文本聚类技术在文本挖掘和信息检索系统中发挥着重要的作用。目前,文本聚类方法大多数采用基于关键词集的经典向量模型来表征文本,这......