面向问题意图识别的深度主动学习方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wuwei72323
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习已经在许多自然语言处理任务中达到了最高水平的性能,但是这种方法通常需要大量的标注数据。该文围绕问题意图识别语料标注问题,结合深度学习和主动学习技术,实现了语料标注成本的降低。主动学习需要不断迭代地再训练,计算成本非常高,为加速这个进程,该文提出了一种适合问题意图识别任务的轻量级架构,使用双层CNN结构组成的深度学习模型。同时为更好地评估样本的价值,设计了一种结合样本的信息性、代表性与多样性的多准则主动学习方法。最终在民航客服语料下进行实验,实验结果表明该方法可减少约50%的标注工作量,同时在公开数
其他文献
随着中国现代科技技术水平的不断提高,机械化、自动化、智能化的现代化养猪设备在大型猪场迅速得到推广研究应用。存在的主要问题包括近年来生猪市场价格方面有所提高等,大部分
电子病历中的临床术语描述形式具有多样性和不规范性,阻碍了医疗数据的分析和利用,因此对临床术语标准化的研究具有重要的现实意义。当前国内医疗机构临床术语标准化主要由人
地理综合题一直是学生的一大难点,失分率之高让老师、考生自己瞠目结舌。其中的原因主要有:审题不仔细、读图能力差、概念掌握不准确、知识应用欠灵活、语言表达能力不强、思
化学物与蛋白质之间的相互作用关系抽取对精准医学和药物发现等方面的研究有着重要作用。该文提出了一种基于最短依存路径和注意力机制的双向LSTM模型,并将其应用于化学物蛋
随着人们收入的增长和安全意识的加强,我国目前对生鲜农产品品质要求进一步提升,生鲜农产品供应链管理是提高流通效率保证品质的重要抓手,因此研究生鲜农产品管理尤为重要。通过
属性对齐的目标是发现异构知识图谱中表示同一概念的属性之间的对应关系,是实现跨图谱知识融合的关键技术之一。现有模型通常利用基于规则和词嵌入的方法进行属性对齐,但这些
义原(sememe)被定义为人类语言中不可再分的最小语义单位。一个词语的意义可以由多个义原的组合来表示。以往人们已经人工为词语标注义原并构建了知网(HowNet)这一语言知识库
GloVe模型是一种广泛使用的词向量表示学习的模型。许多研究发现,学习得到的词向量维数越大,性能越好;但维数越大,模型学习耗时越长。事实上,GloVe模型中,耗时主要表现在两方
事理图谱是一种描述事件之间顺承、因果等关系的事理演化逻辑有向图,它蕴含了丰富的事件间关系,在各领域都具有重要的研究意义和应用价值。当前研究主要集中于公开域的事件抽
【阅读提示】:创作“山水彬县”系列散文,在国内诸多报刊连续推出反映彬县的散文,这仅仅是胡忠伟文学创作的一部分。作为陕西省咸阳市彬县人力资源和社会保障局一名年轻干部,