多种算法对不同中文文本分类效果比较研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:wxjct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为弥补目前国内学者只做单一算法研究且语料单一的缺陷,使用Word2vec词向量模型结合支持向量机(SVM)、卷积神经网络(CNN)和长短期记忆网络(LSTM)3种不同分类算法,研究了不同中文文本分类问题,包括微博语料的多维细粒度情感分类、酒店评价的倾向性分析和新闻文本的主题分类。将3种分类模型在不同文本中的分类效果进行对比,结果显示这3种算法对于不同的中文分类效果各有不同:不同维度的词向量对准确率等评价指标影响很大;支持向量机模型更适合于细粒度的微博情感分类;卷积神经网络、长短期记忆网络算法更适合于噪声小
其他文献
食品系统理论是现代食品经济的新兴理论,倍受国际学术界、食品产业界和政府相关部门的关注。系统论述食品系统理论在国外的形成与发展,研究焦点内容和研究特点,以及对我国的意义
本文通过调查了解中职学生自我发展目标,为教师制定正确有效的教育教学策略提供参考,从而保证学生实现更好的人生发展。
当今云计算、大数据和人工智能等新一代信息技术的广泛应用给城市发展带来了新的机遇,随着我国新型城镇化的建设推进,城市硬质道路不断拓展,硬质地面追踪条件也在不断地发生
<正>2018年12月2日,中国银保监会正式发布《商业银行理财子公司管理办法》,理财子公司正式成为一类全新的商业银行投资的非银行金融机构。作为非银行金融机构,理财子公司实现
喜爱四大名著的读者对脂砚斋等对四大名著的评点一定不会陌生,因为他们的评点帮助读者更好地领悟到四大名著的魅力,其精彩程度可以说是与名著相辉映。可见批注式阅读是能帮助
系统研究了丝状菌膨胀与非丝状菌膨胀2种典型污泥状态下原生动物的群落结构特征及其演变规律。伴随丝状菌的大量增殖,原生动物总量相应减少,匍匐型纤毛虫及有壳类肉足虫数量迅
一体化教学已成为当今技工学校教学的主要教学方式,但是教材、实训设备及一体化师资的滞后是摆在技工学校面前急需解决的问题。传统教学内容、传统实训设备及原有的师资如何
因大名鼎鼎的三文鱼大多都产自挪威、冰岛等北欧地区的寒冷深海中,我国很少有人养殖成功,所以每年只能花很多钱大批进口冻鱼。东北汉子房守库偏不信这个邪,他撇下很赚钱的建材生意,在水流湍急的鸭绿江里投入一个“疯狂计划”。没想到一场洪水就让他损失640万。在专家们都认为“养不成”的情况下,他甚至让在英国取得海洋生物学博士的女儿,放弃国外优厚待遇回来帮忙。如今这父女俩建成了全国最大的淡水三文鱼养殖场,打破国外
湖南省郴州市宜章县第七中学前身为该县历史上八大书院之一的"城东书院",创办于1870年,历经清末、民国、新中国三个时期,先后为国家培养了2万余名人才。如何发掘它的历史文化
摘 要:本文理清当前铁路改革思路,结合《铁道部关于鼓励和引导民间资本投资铁路的实施意见》(以下简称《实施意见》),将铁路非运输企业改革作为铁路改革突破口,阐述非运输企业发展状况及重要性,在非运输企业的改革中引入民间资本,形成改革的倒逼机制,探索《实施意见》的细则、合理建议及可行性措施。  关键词:改革突破口 非运输企业 民间资本 倒逼机制  当前,铁路系统的改革方案仍未出台,社会各界众说纷纭,但铁