基于局部密度的无监督作文跑题检测方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:guohan123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有的无监督作文跑题检测方法中,使用作文内容向量表示作文存在非主题词噪声所导致的相似度不准确问题,该文提出一种基于作文主题词抽取和局部密度阈值选择的无监督作文跑题检测方法。首先使用LDA主题生成模型挖掘待测作文的主题词,并使用分布式表示向量寻找与题目词项语义相似的词,作为对作文题目的主题词扩展,在此基础上使用提出的切题度计算方法计算待测作文的切题度,并使用所提出的基于作文集切题度局部密度的阈值抽取方法动态选取切题阈值,进而实现一种无需训练集和主题无关的无监督作文跑题检测方法。在以英语为母语的学习者和以
其他文献
研究将"教—学—做"一体化教学模式应用于计算机教学的必要性,给出了具体的三模块实训体系实现方案.利用"教—学—做"一体化教学模式教学使学生学到的理论知识与实际操作紧密连接
办任何事情都是有目的的,参加展会自然也不例外。然而,目前我们许多调味品企业在选择参加展会时或多或少的呈现出一种“心中无底”的状态,“不得不参展”和“选择参加什么样的
说到咖喱美食,或许还有不少人停留在妈妈做的咖喱鸡块的阶段,金津必能帮你补上这重要的一课。金津的咖喱原汁都采用上乘香料及咖喱粉烹制5小时以上而成,再加上红、黄、绿、黑
针对传统的关联分类算法在构造分类器的过程中需要多次遍历数据集从而消耗大量的计算、存储资源的问题,该文提出了一种基于知识进化算法的分类规则构造方法。该方法首先对数
“第十四届全国计算语言学学术会议”(The Fourteenth China National Conference on Computational Linguistics,CCL 2015)将于2015年11月13日-14日在广东外语外贸大学举行。作
上海艺杏食品有限公司是一家家族企业。其创始人1979年从南通来上海创业从事豆制品买卖。
本文针对汉字、朝鲜文字和英文单词混合的文本图像提出了基于主成分分析技术以文字为单位进行文种辨识的方法。首先,通过主成分分析方法构造特征空间,并且把分割的文字映射到
红菜头是什么?原来我也不知道。那是上世纪90年代初,我在报社的群工部当版面编辑,有时,也要参加一些公益性的监督活动。如监督出租车司机拒载、宰客啦,打击假烟假酒啦,参加“315”
今年3月,京昆艺术中心正式在上海成立,在新的领导班子里最惹人瞩目的就是新上任的上昆副团长张军了。
期刊