文本分类相关论文
近年来,得益于深度学习技术的快速进步和硬件性能的不断提升,人工智能技术得到了迅猛发展,并在多个研究领域得到了广泛应用。深度......
随着互联网和社交媒体的飞速发展,用户每时每刻都会生成大量的短文本数据,如何对海量短文本数据进行高效、准确的特征表示与分类,......
文本分类任务通常依赖足量的标注数据,针对低资源场景下的分类模型在小样本上的过拟合问题,提出了一种基于提示学习的文本分类方法(BE......
随着交通信息化的快速发展和公众服务要求的不断提高,交通运输行业政府部门对交通数据的共享、保密要求越来越迫切。数据分级作为......
针对静态词向量模型语义表示质量不高,深度学习模型无法聚焦关键特征等问题,提出了基于ChineseBERT-BiSRU-AT的医疗文本分类模型。预......
期刊
本文介绍了文本分类的发展历史和文本预处理的方法,并通过构建卷积神经网络模型和循环神经网络模型,对预处理后的影像报告进行文本分......
HSE管理体系审核不符合项文本语义关系复杂,包含专业术语及缩略语,且同一不符合项往往具有多个分类标签,分类通常依赖人工分析,处理效......
为实现对在线协同研讨知识建构过程的动态跟踪与分析,文章采用文本分类方法,设计了“在线协同研讨知识建构行为自动分析实施流程”。......
互联网宽松环境下社交网络语言攻击频发,在极大地占用公共资源的同时传递了负面情绪,不利于网民的理性思考,智能识别并采取相应措施能......
文本分类是指用计算机对文本(或其他实体)按照一定的分类体系或标准进行自动分类标记。伴随着信息的爆炸式增长,人工标注数据已经变得......
朴素贝叶斯算法在给定输出类别的情况下,需假设属性之间相互独立,然而现实中这个假设一般不成立,导致在属性个数较多或者属性之间相关......
在大数据时代来临之际,知识互联成为人们普遍关心的问题。面向科技资讯领域的数据采集系统可以为用户查询科技资讯类数据并提供专......
[目的]社交网络中存在着许多暴力话题,暴力话题识别对网络舆情的精准干预和管控具有十分重要的意义。当前网络暴力研究主要集中在用......
针对用户的中文评论文本在抑郁倾向上的准确分类问题,提出一种基于领域情感词典与字词特征融合的中文抑郁症文本分类方法.首先基于......
文本分类作为自然语言处理中最为基础的任务,文本分类的粒度决定了下游任务如智能问答、关系抽取完成的质量。文本分类的实际应用......
新闻资讯一直是人们获取社会实时动态的重要来源,随着科技发展进步,获取新闻讯息的媒介已经逐渐从报纸和电视,逐步演变成互联网平......
随着旅游现代化、旅游智慧园区的发展以及互联网的技术的成熟和推广,基于互联网的智慧旅游也有了新的时代需求。游客网络行为的诉......
随着科技的快速发展,人们通过手机、电脑等电子设备获取新闻的方式多种多样,这些新闻通常以文本的形式存在于我们的日常生活当中,......
青春期是心理问题的高发期,其中心理疾病和自杀问题尤为突出。现有利用计算机相关技术解决心理预警问题的方式主要有两种,一是通过......
随着铁路客票系统12306互联网售票功能的不断优化,使用该系统购票的旅客数量与日俱增,伴随而来的投诉问题也呈现多样化的特点,如何......
近年来,在数字化时代的背景下,随着网络信息技术在社交媒体、电子商务、信息检索和推荐等领域的广泛应用,互联网上复杂文本的数量......
针对现有的新闻文本情感分析任务中,单一模型提取文本特征的片面性,且无法充分提取新闻文本语义等特征问题,提出一种基于门控单元特征......
文本分类是自然语言处理的一个重要领域,随着深度网络的发展,大规模预训练模型日渐成为文本分类任务的主流模型,但大模型的推理速度慢......
由于互联网数据众多,为高效管理互联网的海量中文文本数据,提出基于Albert与TextCNN的中文文本分类方法(简称为ATT)。该方法引入Albert......
为更好的实现图书馆文献管理,提出基于随机森林的图书馆馆藏文献自动分类方法。使用TFC权重算法提取文献特征,计算各特征权重。构建......
本文立足于当下政府对中国各类企业安全方面的管控情况,了解到尽管相关管控工作已取得不错的成绩,但是仍然存在部分企业企图投机取巧......
基于用户评论数据,本文对电商平台中搬家行业的用户满意度进行了研究。首先,对评论数据进行分词并词频统计,根据高频词汇和专家经验,确......
在传统的文本分类中,KNN算法以其简单、分类准确率高、非参数得到了广泛的应用。但是传统KNN算法在进行文本分类的过程中,需要计算待......
互联网的普及和网民规模的不断壮大,支撑了我国电子商务的巨大发展,在线购物深受消费者喜爱。随着社交媒体的发展,电子商务也逐渐......
本文针对词粒度注意力的缺点,通过借鉴HAN层次化注意力机制的思想,提出将层次化注意力机制运用于编码器层中,进而得到句子粒度的隐藏......
作为自然语言处理(Natural Language Processing,NLP)的基础任务,文本分类的目标是用一个或多个类标签对文本进行标注,在信息挖掘和......
在互联网信息时代,文本数据呈指数增长,如何管理和分析海量的文本数据已经成为一项挑战。近年来,自然语言处理领域中的文本分类研究取......
随着互联网的飞速发展,人们获取信息的方式变得更加多元便捷,网络数据总量也因此呈爆炸式增长。如何从海量数据中提取有价值的信息......
随着现代信息科学技术的发展,互联网用户的爆发式增长,对海量数据的处理在数据处理领域正变得愈发重要,而人工神经网络(Artificial ......
与传统的机器学习模型相比,深度学习模型试图模仿人的学习思路,通过计算机自动进行海量数据的特征提取工作。文本分类是自然语言处理......
从CNN、RNN、CNN-RNN、GCN及其他深度学习方法五个方面,全面分析了其在短文本分类应用中的研究现状,比较了各自的优缺点,总结了常用的......
垃圾邮件一般是指未经用户请求强行发到用户电子信箱中的包含宣传资料、病毒等内容的电子邮件,它具有批量发送的特征,且会在互联网上......
智能教学系统中,依据学生学习需求及兴趣推荐个性化学习内容,是目前智能教学系统中的关键技术,其实现方法要求首先实现对学习资源......
在大数据时代,信息呈现爆发式增长。如何从海量的互联网文本中挖掘出有价值的信息,实现文本数据的高效管理和有效利用,是一个极具......
为深入挖掘网络评论数据的价值,便于商家了解产品的不足,为用户提供购买建议,提高用户满意度,利用LSTM模型、贝叶斯模型和BERT模型,对评......
维吾尔语属于低资源语言又属于黏着性语言,在很长一段时间都缺少足够的语料来训练维吾尔语预训练模型,造成维吾尔语无法像中文那样基......
随着人类社会进入互联网时代,人们生活的方方面面都与网络密切相关。截止至2021年6月,我国网民人数已达到10.11亿。在如今数据量庞......
文本分类作为自然语言处理领域一项重要的研究课题,具有十分重要的实际应用意义。由于近年来深度学习相关技术的迅速发展,文本分类......