【摘 要】
:
社会治理文本是政府进行社会管理的重要依据,其中包含了公众对社会中存在的各种问题的反映,蕴含着丰富的社会价值,所以从中准确提取民众关心的热点问题至关重要。但是这些文本数据规模比较庞大,处理起来十分繁琐,加之这些文本还具有长度较短,内容长度不固定等特点,甚至可能含有许多无话题表征能力的冗余文本。这就使得从这些文本中了解当前社会的舆情热点变得比较困难,针对这些问题,本课题决定利用文本挖掘技术开发用于帮助
论文部分内容阅读
社会治理文本是政府进行社会管理的重要依据,其中包含了公众对社会中存在的各种问题的反映,蕴含着丰富的社会价值,所以从中准确提取民众关心的热点问题至关重要。但是这些文本数据规模比较庞大,处理起来十分繁琐,加之这些文本还具有长度较短,内容长度不固定等特点,甚至可能含有许多无话题表征能力的冗余文本。这就使得从这些文本中了解当前社会的舆情热点变得比较困难,针对这些问题,本课题决定利用文本挖掘技术开发用于帮助发现社会热点问题的文本分类方法。LDA主题模型是一种语义挖掘方法,本文首先使用LDA对社会治理文本进行分类,推断出文本中话题混合分布的参数以及语义信息,从而鉴别新文本的主题等信息并进行分类。对实验结果进行分析和评价之后,提出一种将LDA和贝叶斯网络结合的分类方案,利用LDA语义挖掘的优势对社会治理文本进行特征扩展,然后对扩展之后的文本使用贝叶斯网络分类,从而提升文本分类效果。在文本分类研究中,专家学者开始使用深度学习领域算法,并在一些分类任务中取得比传统机器学习算法更好的性能。深度学习可以主动学习文本的句法和语义特征,进而获取文本信息的深度特征,降低人工特征提取难度,且具备客观性。所以接下来本文将使用基于深度学习的Bert模型进行社会治理文本的分类研究。不过由于该文本数据具有文本内容短,语法结构不规范,以及文本类别交叉的特点,使得基于Bert的文本分类效果并不理想,因此本文提出将Bert模型和贝叶斯网络结合的文本分类技术。首先使用贝叶斯网络先进行二分类,区分民生查询类和其他类别,然后对其他类别使用Bert再次分类,确定所属的具体类别,从而实现文本分类准确率的提升。
其他文献
最近,如何获得YIG磁体中磁振子之间的高纠缠是量子光学研究领域的前沿课题之一。微磁体中磁振子间的纠缠不仅可以用于验证宏观的量子效应,而且在宏观量子器件、量子信息处理等方面具有很重要的应用。由于钇铁石榴石(YIG)材料具有很高的自旋密度,可以实现光子和磁振子之间的强耦合,且磁振子具有很低的耗散率,这为实现磁振子间的纠缠奠定了基础。本文研究置于同一微波腔中两个近距离YIG微球中磁振子之间的纠缠性质以及
中小企业是中国当代国民经济的重要组成部分,其发展有赖于区域经济增长与社会和谐稳定。但是现如今我国许多中小企业的营销体系不完善,这对企业的销售业绩和经济效益都产生了负面影响。在这一前提下,本文分析了中小企业的市场营销问题,并提出了具体对策。
面对现今由动植物病原体引发的生物安全问题及生物安全检测领域中对快速准确的检测技术的重大需求,本文通过微流控芯片微通道和微叉指电极数值模拟,设计了嵌有微叉指阵列金电极的微流控芯片,并且搭建了用于病毒快速准确检测的微流控阻抗检测与分析系统。利用该系统实现了番茄环斑病毒的阻抗检测,建立了不同浓度病毒和阻抗值之间的定量检测模型。主要研究内容和结果如下:(1)研究了微流控阻抗检测原理和电化学阻抗谱方法,设计
随着我国经济社会的高速发展,钢结构建筑在各种基建工程中逐渐占有重要地位,其发展重要性不言而喻。对于桥梁而言,传统的木桥和混凝土桥梁也逐渐由钢结构桥梁替代,而工程建设缺陷和长时间服役容易使桥梁表面形成慢性病害,若不及时监测和治理这些缺陷,可能会影响桥梁的使用寿命甚至威胁到人民群众生命安全,造成不可估量的损失。为避免这种情况的发生,人们对于钢结构桥梁日常养护以及病害检测的研究正在不断深入。近年来,随着
人们预计高能重离子碰撞中夸克胶子解禁闭形成一种新的物质形态一夸克胶子等离子体(QGP)。碰撞中初始硬散射过程产生的快速部分子穿过热密QGP介质时会与介质中的部分子发生相互作用而损失能量,这种现象被称为“喷注淬火效应”。近二十年来,喷注淬火效应是研究QGP形成与性质的一种重要的硬探针。大量的实验数据证明喷注淬火现象的存在,比如领头强子、单举喷注、双喷注、γ/W/Z标记喷注产额的压低和喷注内部结构的介
近年来,经济的迅速腾飞以及工业化的迅速推进改善了人们的生活水平。然而,化肥和杀虫剂的滥用、采矿、制造业、家庭或工业废物的排放等人类生活以及生产活动致使水污染问题格外突出。其中,分布广泛的重金属污染问题具有长期、隐蔽、不可逆转的特点,严重危害了人类健康,因此我们急需寻求有效的解决办法。另外,以苯胂酸类化合物为主的有机胂类化合物,在环境中经过一系列降解容易转化为高毒性的含砷物种,引发多种环境灾害,有机
近年来,随着人工智能技术的快速发展,水面无人艇作为一种智能化海洋装备越来越受到世界各国的关注。水面目标实时检测技术是无人艇能够有效完成导航避障、环境勘测、海事搜救等任务的关键技术,然而由于水面环境条件多变、检测目标类型众多、船舶航行时颠簸严重、高分辨率图像下小目标检测难、嵌入式计算平台的性能有限等问题,使得水面目标检测速度和精度难以满足实际应用需求。本文根据水面目标图像的特点以及嵌入式计算平台上进
建筑业作为国民经济的支柱性产业,在全面建成小康社会进程中功不可没。但由于建设工程规模大、周期长、人员集中、环境复杂的特点,导致建设工程安全生产难度加大,施工安全事故时有发生。导致事故的原因有很多,已有相关学者研究表明人的不安全行为是诱发安全事故的重要原因。为强化建设工程安全管理,本文开展基于文本挖掘的建筑工人不安全行为及其影响因素分析,掌握因素对行为的影响关系,有利于从源头上控制和消除建筑工人的不
随着工业4.0与智能制造的稳步推进,制造过程中各类产品的协同设计开发与产品生命周期内各类生产资料的集成管理成为从传统制造到智能制造转型的关键突破点。产品生命周期管理(Product Lifecycle Management,PLM)系统,因其整合了各类自动化系统(CAD、BOM、PDM、ERP等)并使它们有机结合,提高了产品的设计质量与生产效率,也提升了整个行业的智能化发展水平。针对PLM管理系统