基于主题的中文短信文本分类研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户:wly9007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据中文短信文本分类的特点,提出同义概念归并、上下位概念的聚焦以及短信文本重点词汇的确定方法,利用主题句选取算法获取短信文本的主题,采用KNN算法将短信文本的主题进行分类。仿真实验结果表明,该算法能够有效提高短信文本的分类速度。
其他文献
1994年中国外汇管理体制改革以来,在中国国际收支“双顺差”的影响下,外汇储备一直保持着快速增长的态势,中国外汇储备迅速增长的来源是国际收支中经常项目和资本与金融项目
目的:分析经阴道3D/4D子宫输卵管超声造影在输卵管源性不孕中的临床运用价值。方法:回顾性分析2017年6月—2018年6月在本院接受诊治的120例输卵管源性不孕患者进行分析,根据
位并行、位向量和聚合位向量算法通过对多个域进行并行处理加快分类速度,但三者内存占用太大,不适用于大规则集。为此,提出一种压缩位并行算法,通过报文分类压缩每个域上的重
目的:探究胸部CT与X线检查诊断胸部闭合性损伤的价值。方法:以2017年3月—2018年6月期间在我院接受诊治的98例胸部闭合性损伤患者为本次分析研究对象。结果:CT检查肺不张准确
本报讯记者王宇牛祥报道近日,《山西省煤炭资源综合利用规划》发布,提出到2020年,全省煤矸石、粉煤灰综合利用量达1.2亿吨,原煤人洗率达80%,洗煤废水闭路循环率达100%,煤层气
报纸
提出一种考虑误差异分布的概率预报方法:根据实测及预报洪水信息,估计不同量级洪水预报误差的概率分布,推导了以预报值为条件的流量分布函数,实现洪水概率预报。以淮河王家坝
本文以广西科学技术出版社为例,介绍出版社采取主动策划外向型图书选题、与国外出版机构紧密联系、积极参加各项对外文化交流活动、创新版权输出方式、主动推荐翻译图书等多
目的探讨PI3K/Akt信号通路对高糖状态下视网膜Müller细胞的影响及机制。方法本实验分两部分,动物实验雄性SD大鼠随机分成对照组、糖尿病组、胰岛素样生长因子-1(insulin
学科是人才培养的核心载体、科技创新的重要平台和社会服务的关键介质。地方高校学科建设面临理念滞后、治理失序、资源不足、评价偏颇等困境和阻力。在"双一流"背景下,面对
为探寻中国政府绩效预算的研究现状,本文从研究内容和研究方法的角度对151篇发表在中文核心期刊(其中120篇所发表期刊同时也为CSSCI来源期刊)的文献进行了分析与总结。结果发