基于句子相关度的文本自动分类

来源 :中国科学技术大学学报 | 被引量 : 0次 | 上传用户:zkry123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于句子相关度的文本自动分类模型(TCSC).该模型利用训练样本增量式地自动更新类别语料库,根据句子的位置权值和语料权值计算句子类别相关度,获得用于文本分类的句子相关度矩阵,通过该矩阵实现文档分类.该模型避免了分类阶段待分类文本特别是中文文本的分词,模糊了词的多义问题,且在文本分类的实验中能够达到86%以上的查全率和查准率;随着语料库的不断训练和调整,分类性能还可以进一步提高,具有简单实现的特点.
其他文献
【摘 要】读者的阅读取向及其变化规律,是图书馆资源建设的依据。本文阐述了高职院校学生阅读情况对图书馆馆藏建设的启示。  【关键词】阅读取向 高校图书馆 资源建设 大学生  大学生是高校图书馆最大的读者群体。他们的阅读取向的变化关系到高校图书馆馆藏建设的发展以及高校图书馆馆藏资源结构布局。为大学生读者提供切实有效的阅读资源,减少馆藏资源的浪费,保障馆藏资源建设的系统性、完整性,成为高校图书馆资源建设
在我国现阶段,特权是指在政治、经济以及其他社会领域内超越了法律和政策规定范围内的个人或集团的权利或权力。在我国现阶段,过度职务消费、“形象工程”、公共权力私有化、权
<正>结肠慢传输型便秘(STC)是临床上常见的、以腹胀及便意淡漠为主要症状的慢性顽固性便秘。近年来对其病理和病理生理改变作了大量的研究,尽管获得了一些有价值的结果,但其
猫和狗看起来非常像它们的主人.  而且,猫和狗能学会如何克服困难,而它们的主人处世似乎就不是那么容易了.  养猫的人就是不能相信有人会偏爱一只杂种狗而讨厌猫.养狗的
期刊
合肥光源逐束团测量和横向反馈系统不仅可以完成合肥光源逐束团的横向振荡、流强测量、纵向振荡和常规反馈任务,同时还开发了对多束团储存环中指定束团的激励,以及形成单束团和
期刊
期刊
利用石油勘探数据库中的岩性分层数据,通过使用地层划分和曲面拟合方法,构造了数值试井分析的求解区域.根据实际的井位得到数值解的计算网格,从而使数值试井更接近生产实际,
在分析船舶机舱火灾危险性的基础上,研究了船舶机舱油蒸气火、喷射火和油池火在不同场景中可能形成的各种火灾类型.通过给出热释放速率、燃烧持续时间和油池火蔓延速度等关键参
目的探讨人性化护理服务在眼科门诊护理管理中的实践效果。方法将我院2017年9月~2018年4月眼科门诊收治的180例患者按就诊时间分为对照组和观察组各90例,对照组予以常规护理