结合TFIDF方法与Skip-gram模型的文本分类方法研究

来源 :电子技术与软件工程 | 被引量 : 0次 | 上传用户:shpeipei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代的发展,各种各样的数据信息不断涌现,如何正确有效地对各种类别信息加以分类、区分,是一个很有研究价值的问题。本文在传统的TFIDF模型的基础上,结合了skip-gram模型,通过对给定语料库的文本进行类别训练,得到了文本的类别向量,接着计算出文档向量和各类别向量的相似度对文本进行分类。实验证明,该方法在给定的语料库范围内,取得了较好的测试性能,准确率、召回率、F1明显优于余弦定理方法。
其他文献
北京是世界上严重缺水的大城市之一,经过近30年的节水工程建设与严格的节水管理,北京市用水及节水水平在全国范围来看已属于领先水平,但是与国际先进节水用水水平相比还有较
新中国成立60多年,为了适应时代发展的需要,汉语在中国经历了一系列的规范化工作,从国语到普通话、从繁体字到简体字、从注音符号到拼音方案的演变过程。同样,泰国的大学汉语
地图在基础地理教育中占有非常重要的地位。随着信息技术的不断发展,地图已从传统的纸质化走向了基于互联网和GIS的新型电子地图应用。近几年来,强调以素质教育为核心的新地
随着我国现代化建设的发展,对城市社区建设也相应提出了更高的要求。城市社区的发展在其中起着越来越重要的作用,是构建社会主义和谐社会的重要领域。加强社区建设、社区管理
互联网的普及,为人类在信息世界提供了更多的沟通手段,在某些程度上甚至颠覆了以往的信息传播格局,相较于传统媒介,网络在现代人获取知识、交流信息上扮演了越来越重要的角色
2010年5月,国务院正式审议通过《国家中长期教育改革和发展规划纲要(2010年-2020年)》,明确了“育人为本”是“教育工作的根本要求”。“道德教育”之于“教育”,其本质和内
本文以甘肃陇南地区民间信仰文化为背景,以陇南地区民间信仰文化中具有重要地位的龙王神信仰文化为研究对象,以一个小社区——台旗——为田野调查点,从信仰体系、仪式体系、
随着我国经济社会的快速发展和生活水平的提高,餐饮业的规模也不断扩张。在光鲜美食的背后,餐饮垃圾的处理问题一直没有得到应有的重视。根据很多城市的调查,餐饮垃圾产生量
长期以来,日益上升的人口压力导致人类对土地的需求也日趋扩大,而对湿地资源的掠夺式开发利用和工业废水的污染带来的环境问题不仅造成了湿地生物多样性的丧失和湿地环境的日