基于卷积神经网络的语句级新闻分类算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:alexkent
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的中文文本分类在海量的互联网信息中难以胜任的现状,提出一种语句级的卷积神经网络中文新闻分类方案。通过信息提取算法从长短不一的新闻数据中提取固定大小的新闻摘要,压缩输入量的同时统一输入格式。信息提取时,通过对TF-IDF算法进行改进提升新闻摘要的质量,结合word2vec技术和卷积神经网络完成文本分类任务。与传统方法相比,词向量模型的引入弥补了传统词袋模型的缺陷,且语句的语义远比词的更加全面,使用语句进行分类更加可靠。通过实验对比验证了该方案具有较好的性能。
其他文献
目的:建立芪冬养血胶囊中黄芪甲苷的HPLC—ELSD含量测定方法。方法:采用高效液相色谱法对芪冬养血胶囊中的黄芪甲苷含量进行测定。色谱柱为Agela—Venusil MP C18(4.6mm×250
目的:对祛风止痛胶囊的质量标准进行提高。方法:用薄层色谱法对祛风止痛胶囊中续断、威灵仙进行定性鉴别;用HPLC法测定川续断皂苷Ⅵ的含量,采用Appllo C18柱(4.6mm×250mm,5μm),
随着社会的发展与进步以及教育改革的不断推进,信息技术和学科教学的深度融合已经成为教育人关注的热点。北京一师附小以"信息化背景下改进教学方式"为主题,以课例研究、行动
文章分析了大数据时代图书馆信息服务的变化,阐述了大数据时代图书馆数字文献资源建设、开发及利用应遵循的原则,指出了大数据时代图书馆数字文献资源的建设及开发模式,最后
目的探讨宫腔灌注地塞米松对中重度宫腔粘连子宫内膜雌激素受体(E2R)、转化生长因子-β1(TGF-β1)及血管内皮生长因子(VEGF)的影响。方法选取2016年10月~2017年6月广东省深圳
文章分析了社会力量参与公共图书馆服务体系建设的现状,以社会力量参与广州市公共图书馆服务体系建设的实践为例,总结了存在的问题,提出了相应的建议,以期建立社会力量参与公
在最平常的日子里,一场疫情打乱了人们的工作、学习和生活。"停课不停学"作为疫情防控的应急之举,无意间开启了一次史无前例的在线教学实践。2003年,"非典"肆虐期间,北京等地
2020年的春季学期对每一所学校来说都是不平凡的。新冠肺炎疫情防疫背景下的教育教学能否有序进行且质量不降低,是对学校干部教师应变能力的考验,也是学校能不能把危机转变为
为探讨不同酒精滴定浓度阳性乳患牛血清钙、磷和羟脯氨酸含量的变化。首先剔除加州乳房炎检测阳性的奶牛,用68%的酒精全群检测酒精阳性乳,再用72%的酒精测定68%的酒精阴性牛乳,最后
针对距离平方反比插值算法(IDW)未能考虑事物的方向性特征以及插值精度较低的情况,提出一种带方向的各向异性空间插值的优化算法。通过最小二乘法的椭圆拟合改进算法确定椭圆