基于强化语义的中文广告文本识别技术研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:wang840911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网是广告推广的重要媒介,但是低质、诈骗、违法等违规广告也大量充斥其中,严重污染网络空间,因此,实现恶意广告的有效甄别对构建安全清朗的网络环境意义重大。针对各类违法违规中文广告内容的识别需求,利用Bert(bidirectional encoder representation from transformers)和Word2vec分别提取文本字粒度和词粒度嵌入特征,使用CNN(convolutional neural networks)网络对Bert高层特征做深层抽取,同时将词粒度特征向量输入到双向L
其他文献
[目的/意义]从政策法规的角度,调查荷兰政府开放数据的政策支持和法律保障,为我国政府开放数据提供参考。[方法/过程]利用文献调研和网络调研的研究方法,以荷兰为例,通过对文
一位老师上《怎样认识物体——土壤》一课,做查明土壤中有腐殖质的实验时,教师把晒干的土块放在铁丝网上用火烧,边操作边问学生“冒烟了吗?有气味了吗?”开始学生没什么反应,
人类社会是在同大自然的斗争中诞生和发展起来的。随着人口的不断增长,生产力的不断发展,工业化和现代化程度的不断提高,人类向大自然索取的越来越多,对生态环境的破坏也就越
目的提高对中脑周围非动脉瘤性蛛网膜下腔出血(PNSH)的认识水平以指导临床诊治.方法回顾性分析24例PNSH病人的临床表现、影像学资料、治疗及预后情况.结果本组24例病人发病1~1
在机器学习中,K折交叉验证方法常常通过把数据分成多个训练集和测试集来进行模型评估与选择,然而其折数K的选择一直是一个公开的问题。注意到上述交叉验证数据划分的一个前提
目的探讨精神疾病司法鉴定中严重程度不同的颅脑损伤所致精神障碍的临床特征及鉴定工作须注意的相关问题。方法根据综合医院神经外科的诊断和格拉斯哥昏迷量表(GCS)评分,把11
在超大规模数据集的分簇管理上,存在大数据获取、存储、检索、分析和可视化等困难。面对爆炸式增长的数据,利用分布式、并行计算原理,在MapReduce模型的基础上构建并行粒子群
针对永磁同步电机启动慢、转速超调高、抖振强、观测误差大的特点,提出一种基于模型参考自适应系统的神经滑模控制策略。通过将径向基函数神经网络算法应用于滑模控制器中,对
目的 探讨细胞凋亡调控基因fas、caspase-3在颞叶癫癎病人病灶内的表达及意义.方法 取30例颞叶癫癎病人手术切除的病灶,应用免疫组化的方法检测凋亡相关基因fas、caspase-3的
儿童广泛性焦虑症的主诉及植物神经症状较成人少[1],但由于该年龄段正处于紧张的学习知识阶段,也是身体、心理发育最关键的时候,故找到一种安全有效的药物是非常必要的.现就