标注数据相关论文
针对中文文本纠错领域中训练深度学习模型所需要的标注数据有限这一问题,提出了五种数据噪声替换方案.通过实验验证,证明了其中的......
说话人识别,也称声纹识别,是通过分析说话人的语音,从而对说话人的身份进行鉴定与认证的一门技术。根据应用的不同,说话人识别分为说话......
半监督学习是介于监督学习与非监督学习之间的一种机器学习方式。目前半监督学习在机器学习和模式识别中的研究在进一步深入。该文......
为减轻医疗领域中标签数据不足的问题。本文提出了一种基于转移学习的医疗图像分类的新方法。提出了一种桥梁数据库与目标数据库采......
图像采集、存储技术的发展成熟降低了图像采集应用的成本,也促进了图像处理与识别技术在各领域的应用发展。图像分析与识别技术的......
为了获得充足的训练语料,提出了半监督的K-means算法(SSK-means),算法的运行过程中不再随机选择初始中心点,而是先从各类标注数据分......
以人脑为代表的生物大脑能在保持低功耗的前提下具备较高的通用智能水平,因此解析大脑工作机理以发展类脑计算,有望成为克服现有深......
属性抽取的主要目标是从非结构化文本中获取实体的属性值。为了从文本中抽取出人物属性,通常需要大量的标注数据,然而这些数据资源......
深度学习的发展依赖于数据,尤其需要大量有标注的样本以支撑模型的训练。在很多领域,标注样本是高成本的,但与此同时存在大量而廉......
半监督聚类算法通常利用标注数据优化类别描述参数(如类的中心),然后通过类别描述参数划分无标注数据的类别,但是没有考虑标注数据......
互联网正在从"互联网+"慢慢转向"AI+"时代,AI其实不单单是一种技术,也是一种观念、一种思维方式、一种方法论。借鉴AI算法的边界意......
事件抽取是自然语言处理研究领域极具挑战性的任务之一,目标是从包含事件信息的非结构化的文本中抽取出结构化的事件信息。事件抽......