教育资源标签生成方法研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:yuxuan423
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“互联网+”教育的快速发展和“三通两平台工程”的实施,网络教育资源越来越丰富,如何快速高效查找到相关的优质教育资源是一个亟需解决的问题。针对教育资源个性化推荐需要,以及教育资源有效的管理利用,本文对数据标签生成技术展开研究,主要包括以下几个方面内容:(1)自然语言的识别和处理技术研究。研究了自然语言处理中的中文分词技术,采用基于规则分词和基于统计分词相结合的混合分词方法对中文文档进行处理、分词。探索了文档内容信息及语义结构的文本表示模型,将自然语言转化为计算机可识别、处理的形式。(2)多特征融合的TTIP算法研究。结合教育资源本身特征,融合TextRank、TF-IDF权重以及位置信息权重等多个教育资源标签特征提出一种新的标签生成算法(TTIP算法)。利用TextRank算法挖掘词语之间的潜在关系,TF-IDF(词频-逆文本频率)权重将语料库信息纳入标签中,考虑教育资源中词语不同位置对资源主题的影响,加入位置信息权重,形成多特征融合的TTIP算法。(3)原型系统的构建、评估和分析。构建了 TTIP、TextRank、TF-IDF、LDA算法的原型系统,并利用准确率、召回率和F值三个指标的平均值和方差来评估四个算法的性能。测试结果表明,TTIP算法各个指标均有所提高,其中F值最高达0.571,平均值为0.34,而方差相对较小,数据波动幅度小,优于常用标签生成算法。算法稳定性好,生成的标签质量高,有利于教育资源的利用和管理,可大大提高优质教育资源的使用效率。
其他文献
近年来,随着深度学习的不断发展,目标检测可以实现高效的端到端检测,与传统目标检测方法相比,基于深度学习的目标检测算法的自动化程度大大提高,检测精度得到有效改善。但在遥感图像目标检测中,目标与背景之间的特征区分度小、目标的尺寸大小不一、某些目标视角特殊等问题严重影响遥感图像目标检测的精度。针对遥感图像目标检测中检测精度不佳等问题,本文提出了基于双注意力机制的DC-SSD(Dilated Conv a
在现代基于无线技术的通信系统中,射频收发机是至关重要的一部分。它的特点是可以在没有电缆的条件下完成信号的发射与接收,其性能的好坏决定了无线通信的质量。而锁相环是射频收发机中的核心模块之一,主要用于收发机前端与后端电路参考时钟信号的产生。其提供的信号源的稳定性决定了变频后信号的质量,其性能决定了整个收发机的性能,频点的最小分辨率决定了信道的宽度,频点切换速度决定了收发机的反应速度。由于工作频率高,工
供水管网作为城市市政设施必不可少的部分,其安全高效运行是城市正常运转的保障。我国供水管网资产庞大,但其本身性质、环境因素、运行工况存在很大差异,部分管道服役时间长、老化现象严重导致管理水平低下,管线爆漏事故频发,漏损率居高不下。管道风险评价使供水企业能够了解管道健康状态及重要性,识别风险较高的管线,提高管网管理维护水平,保障管网安全高效运行。本文综合国内外管道风险研究的基础上,选择概率风险评价模型
呼吸频率是多种疾病的生理指标之一,尤其是急性疾病,因此呼吸频率监测十分重要。呼吸频率的异常变化是儿童肺炎病发的早期特征和症状之一,但是传统呼吸频率测量繁琐且不适感
电机动态扭矩一般使用扭矩传感器测量,但扭矩传感器应变片粘贴的角度容易发生改变,且长期使用容易变形,造成电机动态扭矩测量结果的误差较大,无法对电机矩频特性进行长期稳定测量。为此,本文提出一种扭矩传感器行为模型测量矩频特性的方案,该方案以直流无刷电机为负载电机,通过采用线性回归的方法对负载电机的电流、转速和扭矩之间的关系建立行为模型来测量扭矩,采用对负载电机输出的霍尔信号变化次数进行计数来测量转速,并
随着科学技术的进步,器件集成度随摩尔定律快速增加,半导体器件尺寸也在不断缩小,量子效应及散热等问题难以克服,以电荷自由度为基础的传统电子学日渐艰难。自旋电子学通过结合电子自旋和电荷自由度,具有非易失性、数据处理速度快、能耗低和集成度高等优点,是未来电子信息领域的重要发展方向。磁性半导体同时具备半导体的逻辑功能和磁性材料的存储功能,已成为近年的研究热点。以石墨烯为代表的二维单层材料与范德华异质结由于
随着阵列技术与声音处理技术不断发展,麦克风阵列被广泛地应用到声音采集与处理系统中。麦克风阵列具有极强的抗干扰能力和较高的空间分辨能力,能够解决单麦克风不能解决的声学问题。本论文主要研究基于麦克风阵列的声音识别与定位系统的技术原理,并对系统进行了设计实现,主要完成了以下工作:(1)研究了基于麦克风阵列的声音识别与定位系统的相关技术原理,分析了基于声音信号短时时域分析的声音识别技术和基于到达时间差的声
细胞的形态特征与细胞生理紧密相关,是生物医学研究中的重要观察目标之一,被广泛应用于生理组织和器官的状态检测。近年来,医学影像技术和计算机技术的飞速发展极大地推动了
长时间的抑郁能够导致一个人的失能,需要进行积极的治疗。然而,社会上对抑郁患者的歧视和治疗过程中金钱及精力的大量消耗,致使大部分患者不愿意接受帮助。对此,本文基于自然语言处理(Natural Language Processing,NLP)的相关技术,提出了利用聊天机器人(Chatbot)实现抑郁辅助治疗智能化的方法。通过患者与聊天机器人之间的交互,在没有歧视的环境中,实现对患者免费实时的治疗。其中
随着SAR图像分辨率的快速提高和数据量的巨大增加,SAR图像的快速、准确且自动化的解译变得尤为重要。SAR图像高精度自动分类算法是SAR图像理解与解译的基础,为不同应用场景的结果分析打下了坚实基础。论文利用深度学习的方法来进行SAR图像阴影、水体和叠掩的分类,主要研究工作如下:(1)SAR图像中的阴影、水体区域灰度值接近且相干斑噪声影响较大,目前还不能实现自动准确地提取。针对这个问题,论文提出一种