【摘 要】
:
构建基于语境的中文性别欺凌语料库,提出了一种基于语境、结合注意力机制的切片循环神经网络和胶囊网络并联联合算法模型(CASC)。相比传统基于词法规则、句法分析等深度学习神经网络,上述方法可以获取时序词级、句子级、段落级等多个层级高级信息和全局语义信息。同时通过分析上下文语境,挖掘欺凌词之间的依赖关系和深层语义特征,来提高特征表征能力。实验结果表明,上述方法用于网络性别欺凌文本识别精确率为95.33%
【机 构】
:
新疆大学软件学院,新疆大学网络中心
【基金项目】
:
国家自然科学基金(61563051,61662074,61262064),国家自然科学基金重点项目(61331011),新疆自治区科技人才培养项目(QN2016YX0051),新疆天山青年计划项目(2017Q001)。
论文部分内容阅读
构建基于语境的中文性别欺凌语料库,提出了一种基于语境、结合注意力机制的切片循环神经网络和胶囊网络并联联合算法模型(CASC)。相比传统基于词法规则、句法分析等深度学习神经网络,上述方法可以获取时序词级、句子级、段落级等多个层级高级信息和全局语义信息。同时通过分析上下文语境,挖掘欺凌词之间的依赖关系和深层语义特征,来提高特征表征能力。实验结果表明,上述方法用于网络性别欺凌文本识别精确率为95.33%,召回率为95.83%,衡量模型整体性能的F值为95.58%,准确率为98.78%。从而证明上述方法用于
其他文献
为降低多源信息背景下平行语料库重复句段对翻译工作的干扰,提升去重效率,设计一种基于词频-逆向文件频率技术的平行语料库相似句段去重算法。构建平行语料库句子一级对齐关联,设计概率模型,挑选最大概率路径为对齐输出,运用基于长度的句子对齐方法,确立源语料库中语言单位与目标语言文本间的翻译关系;根据句段词表层特性与信息熵,从多源语料库中择取少量待选实例并进行泛化匹配,得到句段相似程度;根据单词主题相关性推导
针对当前机器人智能抓取未知目标位置识别方法未考虑目标轮廓图像特征融合,导致复杂环境中识别效果较差,定位误差较大,目标位置识别率较低的问题,提出机器人智能抓取未知目标位置深度识别方法。利用40层的深度残差网络识别模型检测未知目标,通过训练获取未知目标的类别属性信息后,随机确定抓取目标,并计算确定目标的当前图像特征,融合当前特征与期望特征,利用滑模控制逻辑设计视觉控制器,通过视觉滑模定位控制律,控制机
研究了支撑柱排布间距、高度及直径对钢化真空玻璃支撑应力的影响,建立了钢化真空玻璃力学模型,采用ANSYS软件分析了不同支撑条件下的钢化真空玻璃支撑应力与变形情况。研究结果表明,随着支撑柱排布间距的增加,钢化真空玻璃支撑应力与变形也随之增大;支撑柱高度对钢化真空玻璃的支撑应力与变形影响较小;支撑柱直径增大,钢化真空玻璃的支撑应力与变形呈现下降趋势。综合制造工艺及支撑稳定性考虑,建议钢化真空玻璃的支撑
细胞结构的数学分析是生物学理论化的一个研究方向。以一种特定的栅藻即2-细胞龙骨栅藻为例,在现有的绿藻细胞成形机理分析基础上,提出细胞水平受力与纵向受力不均造成了细胞形态的变化,通过细胞受力分析和变分模型引入带权参数建立了椭圆形的细胞数学模型。构造了以面积为目标函数,周长为约束条件的Lagrange函数,从而达到细胞成形机理的分析。还利用已有的细胞数据进行仿真分析,对模型进行了误差分析和模型比较。结
由于网络数据库中缺失数据具有噪声,导致网络数据库不完整信息填充结果偏差较大,提出基于多元回归KNN的网络数据库不完整信息填充方法。采用灰色关联度计算方法对数据库中的不完整信息进行检测,根据检测结果,利用信息熵的属性约简算法,对不完整信息进行约简处理。采用多元回归KNN方法计算网络数据库中目标数据与完全值数据矩阵中所有数据记录的欧氏距离,并选出欧式距离最小的数据记录作为目标数据的最近邻,判断目标数据
传统的基于轮廓的角点检测算法常常会因为阈值选择不当,使检测准确率降低。针对上述问题,提出一种多支撑区域下模式化的角点融合方法。首先计算曲线上各点的曲率值,然后对曲线上的点进行初步筛选并分组,使曲线上相邻且曲率相近的点分为一组,在每组中选取局部曲率极大值点作为备选角点,再修改支撑区域,重复上述步骤,产生多组备选角点,最后对轮廓曲线进行模式划分,在不同模式下进行角点融合。实验分别在旋转变换和伸缩变换下
传统算法不能有效结合半结构化数据特征,在进行算法运行过程中所查询的数据量较少,且时间较长。于是基于群体智能研究了一种新的半结构化数据查询算法。采用粒子群优化算法建立半结构化数据查询模型,标记空间内的数据特征,运用中心-离散算法对计算模型数据中的不同粒子类型进行查询,在不同范围内实现对数据的查询与搜索。采用映射方法形成数据查询模型集合,并利用映射关系与有向图中的数据内容建设半结构化数据模型储存空间,
现有的DNS隐信道检测算法大多数依赖多次的DNS信息交互数据,然而在大规模流量的网络环境中,DNS数据难以收集完整并分流,从而导致检测模型失效。针对上述问题,提出了一种基于单次DNS请求和响应报文特征的DNS隐信道检测模型,并分析并提取了DNS请求与响应报文多维度的长度和字符特征,最终提取19维特征,并使用四种机器学习算法进行分类,其中J48决策树综合结果最好,对DNS隐信道检测率为99.4%,误
由于以往加密方法是将所有的图像信息全部加密成密文图像,导致图像信息膨胀,影响了图像信息传输质量。为解决上述问题,研究一种基于DataSocket技术的序列监控图像敏感数据加密方法。方法先是序列监控图像敏感数据压缩处理,减少信息冗余度,具体包括图像分块、颜色空间转换、离散余弦变换、离散余弦变换系数量化以及编码等操作;然后利用混沌系统进行图像加密处理,包括实数混沌序列生成与转换、置乱和扩散等。实验结果
谱聚类可以任意形状的数据进行聚类,在聚类集成中能够有效的提高基聚类的质量。以往的聚类集成算法中,聚类集成得到的结果并不是最终聚类结果,还需要利用聚类算法来获得最终聚类结果,在整个过程中会使得解由离散-连续-离散的转变。提出了一种基于谱聚类的双边聚类集成算法。算法首先在生成阶段使用谱聚类算法来获得基聚类,通过标准互信息来选取基聚类。将选出来基聚类和样本作为图的顶点,并对构建的图利用双边聚类算法对基聚