基于LDA和word2vec的英文作文跑题检测

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:guojinhong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前国内的英语作文辅助批阅系统缺少准确而高效的跑题检测算法的问题,提出了一种结合LDA和word2vec的跑题检测算法。该算法利用LDA模型对文档建模并通过word2vec对文档进行训练,利用得到的文档主题和词语之间的语义关系,对文档中各主题及其特征词计算概率加权和,最终通过设定合理阈值筛选出跑题作文。实验中通过改变文档的主题数而得到不同的F值,确定了最佳主题数。实验结果表明,所提出的方法比基于向量空间模型的方法更具有效性,可以检测到更多的跑题作文,并且准确率较高,F值达到89%以上,实现了作文跑题检
其他文献
近年来,由于建筑节能要求的不断提高,建筑材料的不断发展,建筑墙体的自保温技术在国内建筑行业受到了越来越多的关注。本文介绍了一种新型墙体材料——HB混凝土自保温砌块和
以多元民族文化著称的云南总是吸引着各类学者的目光,其中,拉祜族作为中国最古老的民族之一,拥有独特的历史文化。同时,拉祜族作为一个跨境民族,经历了长时间的民族迁徙,其建
随着沿边金融改革工作逐步推进,各项经济优惠政策落实到位,广西金融市场开放开发程度深化,跨境资金流动明显出现连续增长趋势。但是,广西仍处于沿边金融改革开局阶段,短期巨额的跨
随着金砖国家经济体的飞速发展,日益增多的贸易摩擦成为我国急需解决的问题。本文采用负二项回归多变量模型,凭借世界银行反倾销数据库、国家统计局的相关数据,从宏观角度探
采用修正剑桥模型,研究在平面应变条件下正常固结土剪切带的产生机理和剪切带形状的多样性。研究结果表明,剪切带是由材料的不均匀变形引起,并由试样局部应变能释放的冲击作
由于自然和人为活动导致的饮用水受氟化物污染被认为是世界范围内对人类健康构成严重威胁的主要问题之一。氟是身体内痕量所需的必需元素,但当摄入人体中浓度超过1.5 mg/L时,对人体就会造成器官的伤害。地壳中含氟约0.06-0.09%,在最丰富的元素顺序中排列13。因为在含水介质中具有电负性,所以在水中形成氟离子(F-)。人类和动物接触到的氟化物主要来自水资源和植物中。在人体中聚集过量的氟化物会导致牙齿
在平面应变状态下,由于土体在应力峰值状态出现了应变局部化现象,从而变形模式失去了原有的均匀性而呈现软化特性。为此,采用常规的弹塑性本构模型模拟土体峰值前的均匀变形,对应
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的 探讨肛周尖锐湿疣的治疗方法.方法 采用5-氟尿嘧啶和干扰素及更昔诺韦联合中医治疗肛周尖锐湿疣.结果 随访期间,60例患者中,治疗组治愈率86.67%,对照组为56.67%,治疗组的