基于文本分类的物联卡违规售卖识别模型

来源 :苏州大学 | 被引量 : 0次 | 上传用户:akk871204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物联网是一种将计算机、通信、控制等多种技术融合的复杂系统,如今物联网信息产业已经形成完整的产业链,融入到社会生活的方方面面,物联卡作为物联网技术的核心,也早已被广泛应用于各类无线联网的智能终端设备中。然而,由于物联卡数量庞大且无需实名的特性,存在许多不法渠道和途径可进行物联卡交易,导致物联卡出现在灰色市场甚至违法犯罪中。这不仅威胁着物联网行业的长足发展,更是破坏了基于SIM的通信领域的市场规范。因此,完善物联卡监管技术迫在眉睫。针对物联卡挪用、转用、滥用等风险,目前运营商的技术检测一般在保障用户隐私的前提下通过对卡用户的位置、轨迹、交互信息、语音、数据等特征进行分析,建立行为画像,防范违规风险场景,却很少从违规售卖物联卡的渠道入手。与此同时,深度学习正经历快速创新发展,在自然语言处理领域,深度学习的文本分类、预测等应用也可获得较高的准确率。本文则从这两点出发,通过文本分类的手段,对短视频平台的一些用户利用发布视频、发表评论的机会违规宣传售卖物联卡的行为进行识别。本文构建了基于文本分类的物联卡违规售卖风险识别模型。首先,运用了 BERT-textCNN模型和BERT-BLSTM模型作为文本分类方法并使用权重动态融合的思路优化了 BERT的各层权重,相比单纯使用BERT模型提升了分类效果。接着,一方面通过实际提取短视频APP的视频简介和视频评论文本,进行模型训练与预测,验证了此风险识别模型的有效性;另一方面阐述了物联卡违规售卖风险识别模型中的具体工作流程,如自动化提取短视频APP文本数据、数据预处理、文本分类模型训练与预测等。向物联网行业提供了一种能够有效节省人力资源、降低安全监管成本的风险监管新方案。
其他文献
本文的主要讨论对象是有n+1个离散不动点的有S1哈密顿作用的2n维紧致辛流形.首先介绍了辛流形上辛形式的基本概念和性质,并对常见的流形(如R2n,S2n,RPn,CPn)是否是辛流形作了探讨.在此基础上,本文进一步介绍了辛流形上的辛向量场和哈密顿向量场的概念和性质,然后定义了一般李群在辛流形上的哈密顿作用和流形上的矩映射,并证明了二维紧致辛流形中只有S2上有哈密顿作用.事实上,哈密顿作用的不动点和
学位
本文我们主要研究动力系统的不变集合的维数,不变测度的维数以及它们与次可加,超可加拓扑压方程的根的关系。假设f:M→M是m0维紧致光滑黎曼流形M上的C1映射,Λ?M是f的非共形排斥子且f|Λ是拓扑传递的,若Λ有一个控制分解(?)Ek且(?),我们证明超可加拓扑压方程的根给出了非共形排斥子的Hausdorff维数的下界,次可加拓扑压方程的根给出了非共形排斥子的盒维数的上界。进一步考虑m0维紧致光滑黎曼
学位
在标记群空间中利用拓扑的观点去研究群列的极限是一种全新的群论研究思路,群列的极限与群的全称理论、群的超积以及超滤子等均有联系.标记群空间的拓扑结构尚不清晰,有限群的闭包的刻画是其中一类重要问题,人们已经知道有限二面体群列和广义四元数群列的极限,本文致力将这些结果推广到拟二面体群列、半直积型有限亚循环p-群列以及一类Kronecker亚循环群列.本文证明了拟二面体群列的收敛性并求出其极限,在证明过程
学位
本文主要讨论二阶脉冲常微分方程组拟周期解的存在性,其中nl∈N+.文中我们主要应用KAM(Kolmogorov-Arnold-Moser)方法证明了当脉冲项Ij(x,x),Jj(x.x),j=±1,±2,…充分小时,上述方程具有无穷多拟周期解.注意到本文考虑的是高维系统(相空间为R2m,m>1),因此并不能得到全体解的有界性这一结论(m=1情形下的Littlewood问题详见[9,10]).全文主
学位
Lorenz系统描述了经典的“蝴蝶效应”,尽管它是混沌的,但是在大范围上展现出一致的动力学行为.本文主要从统计的角度研究Lorenz系统的符号编码,并应用编码技术给出平衡态唯一性的一个证明:当奇点不支撑平衡态时,存在唯一的平衡态.为了讨论平衡态,我们首先将三维Lorenz流约化为二维截面映射,再将二维截面映射约化为一维区间映射,并且在约化过程中保持拓扑压一致,从而问题被归结为一维区间映射的平衡态存
学位
羽毛作为产量丰富、易于获取的天然蛋白质资源常被当作垃圾丢弃,不仅是对蛋白质资源的浪费,还会滋生细菌、污染环境,危害人类健康。因此,对废弃羽毛合理开发利用,提高羽毛角蛋白附加值显得尤为重要。羽毛角蛋白资源的回收利用既要解决羽毛角蛋白的溶解提取问题,也要根据羽毛角蛋白结构性能合理拓展应用领域。本文用低共熔剂(DES)和去离子水组成的溶解体系溶解提取羽毛角蛋白,然后将其与丝素蛋白共混制备角蛋白/丝素多孔
学位
变量的相关性度量一直是学者关注研究的重点,在统计、金融等各领域占有重要的地位。传统的协方差与相关系数方法在度量相关性方面存在许多局限性,它们只能衡量线性相关关系,不能很好的度量变量间的非线性关系或同时对多个变量之间的相关性进行比较。近年来,Copula函数被广泛运用于分析多元随机变量之间的相关结构。运用Copula,可以灵活的构建多元分布函数,准确的描述多个变量之间的相依性,且对变量的分布不做约束
学位
环境污染是当今世界最关注的问题之一,水污染的治理尤为重要。目前,光催化氧化法降解印染废水作为控制水污染的一种有效方法,已成为环境保护领域的研究热点。氧化锌(ZnO)因其优异的化学稳定性,无毒无污染,成本低廉,光催化效率高等优点,被认为是最有应用前景的光催化材料之一。但在治理印染废水的实际过程中,发现ZnO存在光吸收范围窄、光生电子-空穴对的复合速率高以及易团聚等缺陷。ZIF-8材料以Zn2+为配位
学位
压缩感知理论突破奈圭斯特采样定理的限制,将采样与压缩步骤相结合,通过较少的测量值即可实现图像的精确重构。本文针对基于神经网络的图像压缩感知算法CSnet(Image CS Framework Using Convolutional Neural Network)[1]研究了不同注意力机制模块、损失函数和反卷积对CSnet网络重构效果的影响,主要内容如下:一、基于CSnet重构网络,引入注意力机制模
学位
本文主要利用变分方法和Galerkin方法研究了有界光滑区域Ω上双调和方程弱解的存在性与多重性.在第二章,我们考虑了如下薄膜方程多变号解的存在性,其中Q是RN(N≥ 1)中有界光滑区域,Δ2u=Δ(Δu)是双调和算子,Δpu=div(|▽u|p-2▽u)是 p-Laplace 算子.且 p>2,λ ∈ R 是参数,f ∈ C(RN,RN)和g ∈ C(Ω × R,R)满足一些合适的条件,特别的.p
学位