FastText相关论文
互联网时代的文本类数据管理的关键在于高效的信息检索、深度的信息挖掘以及自然语言处理。文本情感分类作为这些技术的一个重要环......
以提升fastText短文本分类模型性能为目标,从获取高质量的类别特征、降低N-gram子词中低类别区分贡献度子词对模型学习高类别区分贡......
为了实现根据商品标题信息进行商品自动分类的功能,提出了基于词频-逆文本频率(TF-IDF)的中文Fasttext商品分类方法。该方法首先利用F......
首先分析了当前在市场质量监管领域开展质量风险分析和产品伤害分析的主要做法,再以重点工业品为研究对象,使用中国质量新闻网民生......
根据国家科技部在2020年03专项工作要点中“争取在5G网络融合智慧校园应用、新一代信息技术助推学生安全管理等方面打造一批示范样......
在如今的信息时代,人们的生活离不开各式各样的信息。现在在互联网上获取信息已成为人们生活的常态,随着信息数量的持续积累,这也......
在已发现的Web攻击类型中,注入式攻击发生频率最高,研究一种高准确率且高效的检测模型来应对频繁的注入式攻击,具有重要的理论意义......
针对互联网时代面临的通过人工对海量新闻进行分类较为困难的问题,本文通过贝叶斯、RidgeClassifier和fastText这三种分类器进行新......
针对单一的FastText模型在不平衡中文语料中的情感极性分析效果不好,以及传统Jieba分词对广领域中文文本适应性不强,数据倾斜导致......
作为主流媒体的新闻报刊业,从广告办理、报纸印刷、发行订报到新闻报料,每天接收和处理的客户信息量都巨大.近年来,随着人力成本的......
对于使用域名生成算法生成的恶意域名,传统方法依靠机器学习模型,通过分析字符的统计特征来达到分类和识别恶意域名的目的。然而,......
FastText是一种准确高效的文本分类模型,但直接应用在中文长文本分类领域存在准确度不高的问题.针对该问题,提出一种融合TextRank......
针对高校学生心理状态评估的智能化需求,文中对基于文本信息的心理问题识别方法进行了研究。该方法以高校内部学生论坛的文本为数......
摘要:随着内容人工智能分发系统的不断成熟,各社交新媒体平台采用千人千面的分发机制,满足了广大用户的线下兴趣阅读需求,让不同年龄和......
文本情感分析(又称意见挖掘),是对带有情感倾向的文本进行分析、处理、归纳和推理的过程。本文提出将卷积神经网络(CNN)和双向长短......
随着互联网技术的进步,社交媒体、电子商务蓬勃发展,越来越多的商品交易评论和社交评论出现在互联网中。因此,网络中的各种评论文......
随着网络的快速发展和普及,海量的信息覆盖在互联网所涉及到的地方,各种类型的数据急速增长,而文本数据更是这些信息的主体。现在,......
随着大数据时代的到来,海量数据也随之涌现。语音、图像、文本等非结构化数据体量的增速远大于结构化数据。其中,产品描述等短文本......
近年来,随着深度学习技术的持续发展,问答系统、聊天机器人等智能产品也相继出现,问答系统因可以快速、准确的反馈给用户问题答案......
随着时代的发展和计算机的普及,机器学习、人工智能的兴起,我们的生活、工作方式有了巨大的改变。文本作为互联网最基础的组成部分......
近年来问答对话系统不断受到热捧,问答对话系统主要分为基于特定任务的对话系统和开放域的对话系统。随着技术的不断提升,以及对话......
本文针对即时通信工具(如微信、QQ等)中的对话消息,利用异质集成学习的思想,将特征提取方式不同的三种机器学习模型:FastText、Tex......
快速识别赌博网站有助于从源头治理网络空间中的赌博现象。文章采用FastText算法和Bootstrap集成算法相结合的思路,解决了基于传统......
Question answering systems offer a friendly interface for human beings to interact with massive online information.It is......
在公安工作中,视频监控系统扮演着重要的角色。然而目前对于视频监控系统基于对视频监控点位的划分和管理在一定程度上限制了视频......
文本分类指的是在制定文本的类别体系下,让计算机学会通过某种分类算法将待分类的内容完成分类的过程.与文本分类有关的算法已经被......
提出一种适用于短文本分类的多基模型框架Bagging_fastText(B_f)。它是一种基于自举汇聚法的快速文本分类算法的框架。以fastText......
提出一种适用于短文本分类的多基模型框架Bagging_fastText(B_f)。它是一种基于自举汇聚法的快速文本分类算法的框架。以fastText......
FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频......
针对词向量文本分类模型记忆能力弱,缺少全局词特征信息等问题,提出基于宽度和词向量特征的文本分类模型(WideText):首先对文本进......
With the promotion of Wisdom Court construction and the increasing completeness of judicial big data, the combination of......
在众多的信息交互任务中,智能问答系统已成为重要的应用之一,准确地理解客户提出的自然问题是问答系统的关键所在,针对用户意图识......
词向量是词的一种特征表示,是很多自然语言处理任务的基础步骤。本文介绍了一种用深度学习训练词向量的方法,训练好的词向量具有维......
电商平台的商品分类查询,与文档查询的特点类似,因而可将其纳入信息检索领域的研究范围。用户利用电商搜索引擎进行查询时可能存在......
伴随数据时代的来临,社会的快速发展和科技的迅猛进步给传统招聘带来了巨大的变革,如今的工作招聘更多地体现出规范化、系统化和网......
在保证文本分类准确率的情况下缩短分类时间一直是文本分类领域的一个研究目标。针对目前文本分类处理过程复杂且耗时过长的问题,......
电子商务交易规模日益上升,用户和商品交互数据激增,用户和商家则通过评论得到商品的反馈信息并进行买卖决策。传统的评论分类基于......
蒙汉翻译属于低资源语言的翻译,面临着平行语料资源稀缺的困难,为了缓解平行语料数据稀缺和词汇表受限引发的翻译正确率低的问题,......
随着互联网的普及,人们在网上“冲浪”的同时产生了海量的文本数据,而对文本数据进行分析和归类则是近些年来的研究热点,其中一个......
随着企业的不断创新发展,专利等无形资产通过不断的积累已达到一定规模,知识产权战略也由先前的以量取胜转变为以质取胜,这就需要......
随着社会进入web2.0时代,电脑技术迅速发展和普及,人们越来越多的利用网络来寻求帮助和知识分享,也越来越倾向使用简单快捷的方式......
互联网的飞速发展使得数据大量且迅速地增长,其中大量数据是以文本形式存储的,文本分类作为最常见的文本挖掘技术对于在大量杂乱的......
针对现有中文专利文本的自动分类方法存在分类处理过程复杂耗时长、精度低且对硬件的要求较高等问题,本文提出了一种基于fasttext......
目的利用词向量与文本分类模型fastText来提高股票咨询短文本的分类质量。方法首先在输入层上通过fastText将输入的词序列转化为词......
文本分类是根据文档内容将文档分类为预定义类别的过程。文本分类是文本检索系统的必要要求,文本检索系统响应用户的查询检索文本,......
随着素质教育的实施和小学英语教育教学的改革,英语绘本(针对儿童的心理特点和认知发展水平而设计的一类以图画为主、文字为辅的故......
随着互联网技术日新月异的更迭与发展,越来越多的网络社交平台开始在普通民众的生活中占据重要的分量。网络的发展为人们生活带来......