【摘 要】
:
图书的自动分类是图书管理和图书推荐算法中的基础工作,也是难点之一,而且目前针对中文分类算法主要集中在短文本领域中,鲜有对图书等长文本分类的研究.该文对深度学习分类算法进行了深入细致的研究,并对BERT预训练模型及其变体进行相应的改进.利用复杂层级网络叠加双向Transformer编码器来提取隐藏在文本中的细粒度信息.在预训练过程中,增加实体级别的遮罩,获得对传统BERT模型的改进,提高了模型对中文语义理解的能力.通过添加外部知识提升了该模型的鲁棒性.
【机 构】
:
江西师范大学计算机信息工程学院,江西师范大学图书馆
【基金项目】
:
江西省教育厅科学技术研究(KJLD14021),江西省教育厅省重点教改课题(JXJG1821)资助项目.
论文部分内容阅读
图书的自动分类是图书管理和图书推荐算法中的基础工作,也是难点之一,而且目前针对中文分类算法主要集中在短文本领域中,鲜有对图书等长文本分类的研究.该文对深度学习分类算法进行了深入细致的研究,并对BERT预训练模型及其变体进行相应的改进.利用复杂层级网络叠加双向Transformer编码器来提取隐藏在文本中的细粒度信息.在预训练过程中,增加实体级别的遮罩,获得对传统BERT模型的改进,提高了模型对中文语义理解的能力.通过添加外部知识提升了该模型的鲁棒性.
其他文献
以中国31个省域为研究单元,使用ESDA和空间面板计量模型,探究了2011—2017年省域文化资本存量与旅游业发展的时空关联特征,并分析了文化资本存量对旅游业发展影响的空间效应.
该文系统综述了绿色基础设施的起源与发展、构成与分类.通过文献研究系统梳理了绿色基础设施在保护生态系统、提供生态服务、发挥文化价值以及协同效应等方面的内容.最后,依据中国绿色基础设施的研究和实践现状,提出针对性的发展目标和规划路径.
高尔基体蛋白是一类定位在高尔基体表面上的螺旋卷曲蛋白家族.目前研究最为广泛的有11种高尔基体蛋白,它们分别定位在高尔基体堆栈不同的部位上.其中有3种定位在高尔基体正面膜囊表面上,高尔基体的反面膜囊表面和高尔基体膜囊边缘表面各定位4种高尔基体蛋白,它们以各自肽链羧基端或以跨膜结构域或与小的GTPase结合锚定到高尔基体膜表面.目前它们比较明确的主要功能是参与维持高尔基体结构的稳定和胞质内的膜运输,还有很多重要的功能在持续地研究发掘中.该文综述了这11种高尔基体蛋白功能的最新研究进展,以期为研究人员在该领域中
本文提出了一种基于区间过程模型的时变可靠性分析方法来处理涉及区间变量和区间过程的问题。首先,定义一种基于极值响应的可靠性指标来度量区间变量和区间过程不确定性下结构的可靠性。其次,建立并求解一双层优化模型以获得可靠性指标。在内层中,使用EGO方法计算功能函数关于时间的极值响应;在外层中,对极值响应关于原始区间变量和区间过程级数展开获得的区间变量进行优化,以得到其上边界和下边界。最后,通过两个例子以验证本文方法的有效性。
针对随机-区间混合可靠性分析中复杂功能函数的高非线性和多设计点问题,本文提出了一种结合主动学习Kriging模型与序列重要抽样方法的混合可靠性分析方法。在序列重要采样方法中采用高斯混合分布作为提议分布进行逐级采样,逐步逼近最优重要抽样函数的采样样本;结合序列重要抽样方法的特点,提出了主动学习Kriging模型的两步学习方案,保证算法精度的前提下显著提高了效率。通过数值算例将本文方法与已有的混合可靠性分析方法对比,验证本文方法的准确性和高效性。
针对铸件结构拓扑优化问题,提出了一种新的铸造脱模约束形式。首先,在变密度拓扑优化的框架下,提出了相对密度描述的优化解的逆结构概念;之后,对该逆结构施加附加重力载荷并固定脱模方向的边界;最后,利用该问题的位移解构造铸造约束。通过对逆结构的最大柔顺性施加单一约束,即可避免优化结构出现不可铸造的特征(包括内部孔洞和侧凹),从而保证了铸件结构拓扑优化解的可制造性。二维和三维数值算例验证了该方法的有效性。研究表明,这种积分函数表达的铸件脱模约束本质上为单一约束,具有优化问题求解方便的优点。
相比于单一材料,复合材料具有轻质高强等优点,拓扑优化方法是设计复合材料的方法之一。本文采用改进的参数化水平集方法,更新了水平集迭代格式,并应用水平集带方法在优化过程中引入中间密度,使水平集方法与变密度法无缝结合以改善水平集方法的拓扑寻优能力,降低其初始设计依赖性。本文以最大化体积模量、剪切模量和负泊松比作为材料设计目标,结合均匀化方法预测材料的宏观等效性能,研究了不同体积分数、多种初始设计及水平集带方法的引入对优化结果的影响,并得到了多种满足不同目标函数的微结构拓扑形式。数值算例验证了本文方法在复合材料微
科学研究是探索未知的复杂智力劳动,只有充分尊重科学研究的自身规律,赋予科研人员更大的人财物自主支配权,才能充分调动他们的积极性,激发他们的创新活力。日前召开的国务院常务会议,部署进一步改革完善中央财政科研经费管理,给予科研人员更大经费管理自主权。会议指出,要按照党中央、国务院部署,深入贯彻新发展理念,坚持创新在我国现代化建设全局中的核心地位。
形状记忆合金由于其优良的力学特性得到了广泛关注,并形成了一系列具有变革性的创新应用.为了充分提升形状记忆合金结构的力学性能,提出了一种基于实体各向同性材料惩罚模型S
以嗜盐菌为宿主,从山西省运城盐湖湖水中分离出1株噬菌体,经浓缩纯化后用电镜观察其形态,并进行限制性酶切、蛋白组成分析及生物学特性研究.研究结果表明:分离获得的CJL-7为双链DNA烈性噬菌体,属微小噬菌体科;其头部为正多面体结构,直径约为80 nm,在其衣壳中至少含3种主要结构蛋白;该噬菌体含有脂质包膜,宿主范围较广;低盐处理对该噬菌体的效价几乎没有影响,其活性在30~50℃范围内较稳定,在40℃时效价最高,在碱性条件下活性更强.