搜索筛选:
搜索耗时1.6611秒,为你在为你在102,285,761篇论文里面共找到 2 篇相符的论文内容
类      型:
[期刊论文] 作者:陈莹,陈湟康,, 来源:电子与信息学报 年份:2020
为了挖掘说话人识别领域中人脸和语音的相关性,该文设计多模态生成对抗网络(GAN),将人脸特征和语音特征映射到联系更加紧密的公共空间,随后利用3元组损失对两个模态的联系进一步约束,拉近相同个体跨模态样本的特征距离,拉远不同个体跨模态样本的特征距离。最后......
[期刊论文] 作者:陈湟康,陈莹,, 来源:激光与光电子学进展 年份:2019
为了在说话人识别任务中有效融合音视频特征,提出一种基于深度门的多模态长短期记忆(LSTM)网络。首先对每一类单独的特征建立一个多层LSTM模型,并通过深度门连接上下层的记忆存储单元,增强上下层的联系,提升该特征本身的分类性能。同时,通过在不同模型之间共享......
相关搜索: