一种新闻文本标注方法

来源 :长春工业大学学报 | 被引量 : 0次 | 上传用户:lvtao_cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于改进语言表示,通过预训练模型ERNIE,根据上下文计算出文本数据向量表示.使用LCNN模型对该向量表示进行标注.该方法与CNN、FastText、BERT、BiLSTM、Transformer算法等在准确率、召回率、F1值等评价指标上进行了仿真对比.
其他文献
基于篮球运动员数据,采用双水平收缩估计和SURE收缩估计预测投球命中率,并进行了4个方面(后卫、前锋、中锋和所有运动员)对比分析.首先给出贝叶斯框架下的双水平收缩估计模型,先验分布中包含投球命中率相关信息(如身高、体重等);然后基于最小化风险函数的无偏估计得到超参数估计值,从而得到收缩估计.
介绍了解的适定性、Carleman估计、可观测性不等式和最优控制概念,通过推导证明存在一个控制函数,使原方程的解在t=T时为零,说明此方程具有零可控性.
针对肥胖数据,首先利用Kuschner方法生成初始网络,然后与Halbersberg方法进行结合得到有序贝叶斯网络,最终预测肥胖等级,并寻找影响肥胖的因素.
为解决特征选择中分辨特征之间的依赖和冗余问题,采用动态权重最大相关最小冗余算法(DWMRMR),在5个公共数据集上进行了验证以及算法比较.
利用因子分析方法对吉林省农作物产量的影响因素进行实证分析,结果表明,物质与科技投入因子、水资源因子、温度因子对吉林省农作物产量有较大影响.其次,运用因子分析与熵值法相结合的综合评价方法,对吉林省近22年的农作物生产能力进行了评估.
描述了命名实体识别的定义、背景、发展,分析了研究难点.重点总结分析了命名实体识别技术的研究现状及近期热门的研究方法.最后介绍命名实体识别的标注方法和评价方法.
针对原油价格波动的预测问题,将GARCH-MIDAS模型扩展为两类:A-GARCH-MIDAS模型研究正负面的油价波动因素对原油市场的不同影响;GARCH-MIDAS-X模型将短期成分扩展到额外的波动决定因素,将扩展模型应用于原油WTI数据.样本内估计结果表明,非对称效应对原油价格波动性有显著影响;样本外预测结果表明,非对称效应显著提高了波动率模型的预测性能.
基于2010-2015年新疆旅游统计数据,构建灰色GM(1,1)模型.采用预测值与真实值之差异量化新疆工作成效.结果表明,2016-2019年接待游客总数分别比预测值高出1629.75、3663.80、7316.66、12961.95万人次.
将卷积层改为连续非对称卷积以降低特征参数,引入Inception V1模块增加多尺度特征参数.增加批量标准化(Batch Normalization)层、Dropout层,提升网络泛化性、鲁棒性.仿真结果表明,ILIC相比于LeNet-5网络减少部分训练参数,增加了分类准确率且降低了过拟合,在Fashion MNIST数据集上比较不同batch_size大小,得到最佳分类准确率达到92.10%,相同情况下比原LeNet-5网络提高了2.26%.
针对糖尿病病人生存时间的不确定性及影响因素的复杂性,将模型平均理论引入病人生存时间分析与预测研究,基于糖尿病病人的数据,利用OPT、S-AIC、S-BIC、AIC和BIC 5种方法预测病人的生存时间.研究表明,模型平均方法要比模型选择方法的预测效果更好.