【摘 要】
:
将相关主题模型和多层知识表示方法相结合开展文本情感分析研究。首先,针对传统分割算法的不足和主题间相关关系,采用相关主题模型对文本进行主题特征分割,构造主题先验信息输入预训练语言模型;其次,基于主题先验信息和相关关系向量,采用预训练的语言模型嵌入进行文本词的动态表示,能有效解决一词多义的问题;最后,使用双向长短期记忆模型对文本句子进行表示,考虑每个词的前后信息来捕捉句子的位置信息,在句子表示向量的信息抽取中融入注意力机制,使用多头抽取考虑全局的方式,可以抽取更全面的文本信息。
【机 构】
:
华中师范大学人工智能与智慧学习湖北省重点实验室,华中师范大学计算机学院,国家语言资源监测与研究网络媒体中心
【基金项目】
:
国家自然科学基金项目(61772224)。
论文部分内容阅读
将相关主题模型和多层知识表示方法相结合开展文本情感分析研究。首先,针对传统分割算法的不足和主题间相关关系,采用相关主题模型对文本进行主题特征分割,构造主题先验信息输入预训练语言模型;其次,基于主题先验信息和相关关系向量,采用预训练的语言模型嵌入进行文本词的动态表示,能有效解决一词多义的问题;最后,使用双向长短期记忆模型对文本句子进行表示,考虑每个词的前后信息来捕捉句子的位置信息,在句子表示向量的信息抽取中融入注意力机制,使用多头抽取考虑全局的方式,可以抽取更全面的文本信息。
其他文献
夜间环境是一种宝贵的自然资源.夜空中布满了激励着科学、宗教、哲学、艺术和文学的星星.不要让户外照明改变了我们对夜晚的感知,让我们为了子孙后代,保护好大自然馈赠的灿烂夜空.
数说变化rn近年来,该村在实施水环境综合治理、加快建设河道堤防、强化水域岸线生态保护的同时,充分利用渠江滩涂发展蜜柚、蜜桃、枇杷等特色产业500余亩,生态荷塘产业180余亩,红枫林300余亩,并引进了“花渔江山”、山水林田湖草等项目,村容村貌大幅提升.
为解决高比例可再生能源接入配电网所带来的运行与控制问题,提出考虑风光荷不确定性的有功-无功协调优化方法。首先,综合考虑风光储模型,结合风光荷的不确定性及其预测误差,使用比例选择法产生场景,并基于快速前进法进行场景削减,建立基于风光荷不确定性的有功-无功协调优化模型;其次,使用二阶锥松弛技术和大M法对非凸、非线性条件进行凸处理,将模型转化为混合整数二阶锥规划问题,采用Gurobi优化器对处理后的模型进行求解分析;最后,以IEEE 33节点配电网系统为例,对所建立模型的有效性进行验证。
受黄河流域的水力条件、多介质环境等因素影响,泥沙与污染物动态界面作用机制复杂。近年来泥沙与污染物相互作用研究主要集中在静态条件下,对动态水流条件及微污染物的关注较少。本文在总结国内外对泥沙与污染物界面作用机制及河流污染物去除方法研究现状的基础上,基于黄河流域高泥沙含量的特殊条件,提出水体中泥沙与污染物动态界面作用机制及同步去除方法的研究框架,揭示开展该研究的关键问题及具体方法,为高沙水体中污染物行为及去除方法研究提供理论支撑。
专利中的科技实体是指专利文献中富含科技信息的词汇,抽取专利中的科技实体对科研工作者提高科研效率、企业布局专利体系都至关重要。提出一种基于半监督学习框架与命名实体识别模型相结合的科技实体抽取方法,半监督学习能够利用无标记数据的优势弥补标注数据稀缺的缺陷,利用大量的专利语料在通用领域的BERT模型基础上进行预训练,得到适用于专利领域的BERT模型BERT-Patent,有效提升模型对专利中科技实体的抽取性能。在专利数据集上的实验结果表明,提出的方法在准确率、召回率、F1值指标上分别提高了6.37%、2.99%
紫底绿彩相辉映·晶润滑腻最上乘rn驶入距银川市30公里的滚钟口,举目西望,笔架山的悬崖峭壁上有一道岩层,仿佛紫云萦绕,贺兰石便出自这里.亿万年沧海桑田的变迁,锻造了贺兰山巍峨粗犷的外貌,而它的精华,则镶嵌于海拔2600米左右的悬崖上.岁月失语,惟石能言,美丽的贺兰石,流转于岁月,写满沧海桑田.穿越贺兰山,走进银川市,开启探秘贺兰石华丽变身之旅,网上闻名的贺兰石“快刀手”何立宁的雕刻艺术工作室就在西夏区梧桐花园门口的一间门店里.
2020年6月以来,泉州市应急管理局聚焦“政府急、企业疲”、“安全生产工作在企业严不起来,落实不下去”、基层基础薄弱等问题,以提高企业本质安全水平为重点,以提升企业依法依规生产经营为目的,以重点专项治理为突破口,整体统筹推进冶金等行业安全生产专项整治夯实基层基础三年行动,全力促进冶金等行业安全生产形势持续稳定向好.
安全生产是社会经济发展的基础和保障,是一条不可逾越的“红线”.漳州市委市政府将安全生产工作作为推进各项工作的“总阀门”,置于改革、发展、稳定大局的重要位置.自安全生产集中攻坚战以来,漳州市各级各部门深入贯彻落实习近平总书记关于疫情防控和安全生产工作的重要指示批示精神,坚持人民至上、生命至上,多管齐下、多点发力,为迎接建党100周年创造良好的安全生产环境.
在线教育的一个显著特征是兴趣驱动,通过对学习者的学习行为数据的分析与挖掘,建立学习者的个性化学习兴趣模型,并进一步基于学习者学习兴趣为其推荐合适的课程。首先,建立学习者多层兴趣模型,准确刻画学习者对知识主题、课程及知识领域的兴趣度;其次,构建学习者兴趣关系网,并基于兴趣关系网采用协同过滤方法为学习者进行课程推荐;最后,通过实验验证,证实了所提方法的有效性。
语音识别和语音合成是近年来的热门研究,相关研究主要是在字素音素匹配的基础上进行统计分析,探寻拼写与发音之间的内在规律,达成形音转换。语言自身的混沌性使字素音素匹配非常复杂,提出一种交互式可视化工具,通过从粗到细的动态分类方式完成字素音素增量匹配。在此基础上,通过全局关联性分析揭示英语发音的整体规律,并及时检验和处理匹配错误和特殊发音等异常情况。采用5个著名语料库中的35182个单词进行实验,匹配过程快速精准,并且发现的规律具有高度的可解释性,为相关人员进行语言学习和语音研究提供了坚实的基础。