文档特征提取相关论文
互联网技术和应用的不断发展,使得互联网承载了越来越多的信息。互联网的去中心化发展以及社交工具、自媒体工具在人们生活中的广泛......
文档的特征提取和文档的向量表示是文档分类中的关键,本文针对这两个关键点提出一种基于word2vec的文档分类方法.该方法根据DF采集......
Textrank相比词袋模型有独特的优势,但需要进行多轮迭代和递归运算,常规串行化算法无法满足大数据环境下文档处理的需求。必须借助......
笔者在实际竞争情报工作过程中发现了现有竞争情报工作中存在的问题——竞争情报的搜集和分析主要依靠人工来完成,效率低下;针对这一......
针对微博划分的草根用户与大V用户两个群体。通过LDA主题模型对用户的微博语料进行训练,分别得出两类用户微博关注的主题分布,从而......
以海相中文文本为处理对象,首次将本体知识理论引入海相油气地质专业,介绍了本体知识获取过程中对文本信息的处理方法,还介绍了对......