fastText相关论文
互联网时代的文本类数据管理的关键在于高效的信息检索、深度的信息挖掘以及自然语言处理。文本情感分类作为这些技术的一个重要环......
以提升fastText短文本分类模型性能为目标,从获取高质量的类别特征、降低N-gram子词中低类别区分贡献度子词对模型学习高类别区分贡......
为了实现根据商品标题信息进行商品自动分类的功能,提出了基于词频-逆文本频率(TF-IDF)的中文Fasttext商品分类方法。该方法首先利用F......
根据国家科技部在2020年03专项工作要点中“争取在5G网络融合智慧校园应用、新一代信息技术助推学生安全管理等方面打造一批示范样......
在已发现的Web攻击类型中,注入式攻击发生频率最高,研究一种高准确率且高效的检测模型来应对频繁的注入式攻击,具有重要的理论意义......
作为主流媒体的新闻报刊业,从广告办理、报纸印刷、发行订报到新闻报料,每天接收和处理的客户信息量都巨大.近年来,随着人力成本的......
针对高校学生心理状态评估的智能化需求,文中对基于文本信息的心理问题识别方法进行了研究。该方法以高校内部学生论坛的文本为数......
摘要:随着内容人工智能分发系统的不断成熟,各社交新媒体平台采用千人千面的分发机制,满足了广大用户的线下兴趣阅读需求,让不同年龄和......
随着网络的快速发展和普及,海量的信息覆盖在互联网所涉及到的地方,各种类型的数据急速增长,而文本数据更是这些信息的主体。现在,......
随着大数据时代的到来,海量数据也随之涌现。语音、图像、文本等非结构化数据体量的增速远大于结构化数据。其中,产品描述等短文本......
近年来,随着深度学习技术的持续发展,问答系统、聊天机器人等智能产品也相继出现,问答系统因可以快速、准确的反馈给用户问题答案......
电子邮件在互联网时代扮演着不可替代的角色,垃圾邮件分类既可以阻断无用信息传播,提高用户体验,也可以拦截有害信息降低潜在危险......
近年来问答对话系统不断受到热捧,问答对话系统主要分为基于特定任务的对话系统和开放域的对话系统。随着技术的不断提升,以及对话......
快速识别赌博网站有助于从源头治理网络空间中的赌博现象。文章采用FastText算法和Bootstrap集成算法相结合的思路,解决了基于传统......
在公安工作中,视频监控系统扮演着重要的角色。然而目前对于视频监控系统基于对视频监控点位的划分和管理在一定程度上限制了视频......
文本分类指的是在制定文本的类别体系下,让计算机学会通过某种分类算法将待分类的内容完成分类的过程.与文本分类有关的算法已经被......
提出一种适用于短文本分类的多基模型框架Bagging_fastText(B_f)。它是一种基于自举汇聚法的快速文本分类算法的框架。以fastText......
提出一种适用于短文本分类的多基模型框架Bagging_fastText(B_f)。它是一种基于自举汇聚法的快速文本分类算法的框架。以fastText......
FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频......
针对词向量文本分类模型记忆能力弱,缺少全局词特征信息等问题,提出基于宽度和词向量特征的文本分类模型(WideText):首先对文本进......
在众多的信息交互任务中,智能问答系统已成为重要的应用之一,准确地理解客户提出的自然问题是问答系统的关键所在,针对用户意图识......
词向量是词的一种特征表示,是很多自然语言处理任务的基础步骤。本文介绍了一种用深度学习训练词向量的方法,训练好的词向量具有维......
随着社交媒体的出现,以QQ和微信等交流平台为主的聊天短文本在当今的网络上非常流行。如何从大量的聊天短文本中推断出主题并进行......
电商平台的商品分类查询,与文档查询的特点类似,因而可将其纳入信息检索领域的研究范围。用户利用电商搜索引擎进行查询时可能存在......
伴随数据时代的来临,社会的快速发展和科技的迅猛进步给传统招聘带来了巨大的变革,如今的工作招聘更多地体现出规范化、系统化和网......
在保证文本分类准确率的情况下缩短分类时间一直是文本分类领域的一个研究目标。针对目前文本分类处理过程复杂且耗时过长的问题,......
蒙汉翻译属于低资源语言的翻译,面临着平行语料资源稀缺的困难,为了缓解平行语料数据稀缺和词汇表受限引发的翻译正确率低的问题,......
随着互联网的普及,人们在网上“冲浪”的同时产生了海量的文本数据,而对文本数据进行分析和归类则是近些年来的研究热点,其中一个......
随着企业的不断创新发展,专利等无形资产通过不断的积累已达到一定规模,知识产权战略也由先前的以量取胜转变为以质取胜,这就需要......
随着社会进入web2.0时代,电脑技术迅速发展和普及,人们越来越多的利用网络来寻求帮助和知识分享,也越来越倾向使用简单快捷的方式......
互联网的飞速发展使得数据大量且迅速地增长,其中大量数据是以文本形式存储的,文本分类作为最常见的文本挖掘技术对于在大量杂乱的......
针对现有中文专利文本的自动分类方法存在分类处理过程复杂耗时长、精度低且对硬件的要求较高等问题,本文提出了一种基于fasttext......
目的利用词向量与文本分类模型fastText来提高股票咨询短文本的分类质量。方法首先在输入层上通过fastText将输入的词序列转化为词......
文本分类是根据文档内容将文档分类为预定义类别的过程。文本分类是文本检索系统的必要要求,文本检索系统响应用户的查询检索文本,......
随着素质教育的实施和小学英语教育教学的改革,英语绘本(针对儿童的心理特点和认知发展水平而设计的一类以图画为主、文字为辅的故......
随着互联网的高速发展,以及互联网用户的爆炸式增长,网购逐渐融入人们的生活,尤其是近些年,网购甚至成为了人们的一种生活方式,在2......
在大数据背景下,如何快速准确的从庞大数据集中筛选过滤出有用信息一直是自然语言处理领域的一个研究目标,对用户所提问题进行意图......
互联网技术的发展,越来越多的人将阅读的方式转变为网上阅读。新闻推荐作为一种新闻过滤和用户定位的手段,可以根据用户历史的阅读......
在迅速增加的海量数据中,文本形式的数据占很大比重。文本分类作为最常见的文本挖掘技术,可在大量杂乱的文本数据中发现有价值的信......
随着信息技术持续不断的快速发展,信息产生与传播的速度与日俱增,与此同时,移动互联网技术的更新迭代与智能终端的大规模应用,使人......
随着互联网的迅速发展,网上购物以其方便快捷的优势代替了实体店购物,已成为时下最流行的消费方式。出于谋利的目的,电商平台中出......
当代社会不断发展,经济水平在不断提高,科学技术也在不断发展。经济水平的提高将不可避免地使人们更加关注自身的健康状况,同时对......
针对跨语言相似问句查找问题,提出一种基于共享词嵌入空间计算中文和英文问句相似性的方法。该方法首先用fastText训练中、英文词......
研究针对中医临床症状词描述的差异与分歧,以Word2vec和FastText为工具,基于现有中医药语料库,进行中医症状相似度研究,发现了一些......