【摘 要】
:
基于滑动窗口的方法,结合机器学习分类技术,可以判定文本的作者归属。但是此类方法需要精心挑选对应的文本特征,不同的文本特征选取可能会影响判定结果。针对以上问题,提出了
【基金项目】
:
国家自然科学基金(11875042),上海理工大学大学生创新创业计划资助项目(SH2020072)
论文部分内容阅读
基于滑动窗口的方法,结合机器学习分类技术,可以判定文本的作者归属。但是此类方法需要精心挑选对应的文本特征,不同的文本特征选取可能会影响判定结果。针对以上问题,提出了一种基于快速文本分类(fastText)的文本作者归属判定模型。该模型融合滑动窗口的思想,引入词(字)向量、数据增强技术,从而充分利用文本信息、自动提取文本特征,并且以可视化的方式将结果呈现出来。使用该模型来检测《红楼梦》、《Roman de la Rose》的作者归属,实验结果表明《红楼梦》的前八十回与后四十回为不同作者所著、《Roman d
其他文献
在实行素质教育背景下的今天,课堂教学仍是主要的教学组织形式,是学生学习知识的主阵地。在新一轮课程改革推 行下,我们的课堂教学形式已经有了很大的改变,但普遍存在着课堂
计算机技术飞快发展,标志着我国已进入互联网信息化时代,网络数据库亦被广泛使用。在应用网络数据库的过程中,社会各级对计算机网络数据安全性给予高度重视,则保障用户数据信
国际贸易与国内贸易不同,国内贸易相较于简单一点,而国际贸易与世界接轨,需要交易的对象遍布各个国家,因此 在交易的过程中需要考虑交易对象的国家制度、法律甚至宗教信仰等
高中阶段的化学,对于学生来说是一门关键全新的基础学科,既要打好化学知识的理论基础,?还要着重培养学生应用 化学知识的能力。因此,教学中应该引导学生掌握最基本的化学知识
广州从 2010 年开始对区域内的第三方环境检测机构进行备案监管,并不断出台各种细则,引导第三方环境检测机构的 发展。但是广州市第三方环境检测机构目前还存在能力较差、程
计算机信息技术应用范围比较广,其中计算机软件技术在大数据的应用中,能够充分发挥计算机软件技术的便捷性、 广泛性作用,同时也促使计算机技术行业快速发展。本文将对大数据
摘 要:职业教育教学方法既要切实结合教学内容并与其产生联系,又要抛弃传统以教师为中心的教育观念,将注重理论教学的教学方法向重视学生的行为发展转变。如模拟工作环境、案例分析、项目教学等教学行为,还需加强自主性、实验性、创造性等方面的创新。 关键词:职业教育;教学方法;发展创新 职业院校的教师如何培养高技能型人才成为了当前职业教育改革遇到的基本问题,也是当前职业教育改革的主要目的。早在明朝时期,著
为解决汉韩双语平行语料库资源匮乏以及传统句对齐算法面向跨语系语言准确率较低的问题,提出了融合特征的汉韩双语句对齐方法。首先将Bi-LSTM融入孪生神经网络构建句对齐模型,用以分别提取汉语和韩语句子的特征并进行对齐。之后基于语料的特点提取句对齐特征融入输入层。通过与传统Bi-LSTM和不同特征组合的孪生Bi-LSTM的对比实验证明,融入特征的孪生Bi-LSTM方法在句对齐任务中具有更优越的性能。
介绍一种基于LQR算法的车道保持控制方法。采用TLC与DLC联合预警模型结合驾驶员意图识别对车辆当前的行驶状态进行判断并在偏离时做出报警,当驾驶员未做出反应时车道保持系统
随着综合国力持续增强,如何提升我国的文化影响力和国际话语权,已经成为亟待解决的时代命题。跨文化语言服务人才培养要对标中华文化“走出去”和构建“人类命运共同体”的需