众包标注相关论文
随着互联网技术的不断发展,新浪微博这种新型社交媒体深受广大网民的喜爱,成为日常生活中必不可少的一部分。微博每天产生大量的数......
真值发现是解决多源信息融合过程中信息冲突问题的关键技术之一,该工作可以从不同数据源提供的信息中找出最真实的信息,在数据库、......
目前基于有监督方法的命名实体识别技术都需要大规模的标注语料。然而在很多新领域中命名实体定义模糊,标注语料匮乏,而且构建高质......
中文微博命名实体的有效识别对使用微博进行社会舆论监测具有重要意义。鉴于微博更新速度快、语言不规范、噪声多,使得命名实体识......
该文提出了一种基于成对比较的众包标注方法,该方法可以通过非专业人士的简单判断获取标准统一的句子难度标注结果。基于该方法,构......
众包是近年来流行的一种分布式商业模式,采用众包方式获取标注是一种快速廉价获取海量数据标签的有效方式,由于众包平台中普遍存在......
针对自然语言处理教学过程中,同学们对中文分词任务的必要性以及难点缺乏足够的认识这一问题,笔者在一次上机课上组织同学们以众包......