文本增强相关论文
针对民航安全信息自动分类应用中存在样本量不足的问题,利用基于变换器的双向编码器表示技术(BERT,bidirectional encoder represent......
知识是人类认识世界过程中总结出来的客观事实,庞大的互联网中蕴藏着各式各样丰富的知识。非结构化的知识难以被管理和利用,知识图......
随着互联网的发展和文本挖掘技术的流行,经济学和金融学可以通过文本情感分类获取到有用的信息。文本情感分类是有监督学习,所以在......
知识图谱的表示学习旨在将实体和关系投影到低维连续的向量空间中,从而使知识图谱与机器学习模型兼容。知识图谱补全是预测实体之......
随着互联网技术的飞速发展,人类社会积累了大量的理论知识与实践经验。知识图谱以其高度凝练的语义网络结构,成为一种高效的知识表......
情感分析是当前自然语言处理领域中最活跃的研究方向之一。作为细粒度的分析方法,属性级情感分析可以从文本中挖掘出针对不同属性......
自动问答的目的是让机器理解人们提出的问题,并以自然语言的形式给出准确的答案,这项技术需要机器存储大量的背景知识。近年来,知......
为了解决中文自然语言处理任务中因语料库数据量较少导致的语言模型欠拟合问题,通过选取中文短文本二分类、短文本多分类长文本多......
基于深度学习的自然场景文本检测算法进展显著,但对具有密集不规则排布特点的文本来说,由于其间距小、分布密集,导致特征提取困难,......
[目的/意义]政府网络问政平台是政府部门知晓民意的重要途径之一,为提高问政留言分类的精度以及处理留言数据质量差、数量少等问题......
知识图谱被用于描述物理世界中实体与实体间复杂的语义关系,通常由若干个事实三元组构成,三元组的形式为(头实体,关系,尾实体)。知......
视频文本和视频内容高度相关,提供了理解视频内容的有用信息,然而文本往往位于复杂背景之中,从视频帧中定位到文本区域后,如果将其......
期刊
新冠疫情爆发以来,相关谣言时有传播,但传统的谣言识别模型却难以有效判别疫情谣言,因为相较于大量历史谣言数据,疫情谣言的数量还......
近年来,使用机器学习算法从导游投诉文本数据中识别出导游违规行为,辅助旅游监管人员工作,为旅游监管提供依据,成为一个必然趋势。......
文章提出了基于卷积神经网络的群众留言分类算法。首先,通过EDA技术进行数据增强;其次,用jieba和TF-IDF算法提取关键词;最后,通过e......
提出了一种将垂直颜色边缘与分块多帧分析的文本定位与增强的方法。根据文本的垂直颜色边缘特征进行粗筛选,获得和跟踪文本候选区;......
视频中的文本能够给视频检索和索引提供重要的辅助信息,有时视频中的文本包含了其它地方没有的信息,例如电影片头的字幕,有时,视频......
如今多媒体信息的应用越来越广泛。以前图书馆里收藏的资料绝大多数都是纯粹的文本书籍,现在则有了多媒体图书馆,里面收藏的资料包......