论文部分内容阅读
我认为普遍意义上的AI主播,应是通过人工智能算法实现自然语言表达的虚拟人类形象。因此它至少具有大数据支撑和信息可交互两重特征,反映在技术上,首先是音视频采样与合成技术,将人类的语音和外貌特征尽可能真实地还原成虚拟形象;其次是自然语言处理和人脸表情识别等技术,让机器或程序读取并理解人类语言与副语言含义,进而通过算法进行合乎人类逻辑的反馈,实现“人机交互”。