蒙古语AI合成主播完成国内首秀

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:huainanyan_sxnu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本报讯 由内蒙古自治区蒙古文信息处理技术重点实验室研发的国内首款蒙古语“奥云AI合成主播”近日在内蒙古呼和浩特首秀成功。
  据介绍,此次的AI合成主播以蒙古文或汉文新闻稿件为输入内容,通过蒙汉自动互译技术生成蒙汉双语稿件。此外,AI合成技术还可以自动生成与蒙古文稿件对应的主播播报视频和双语字幕,并可以自动编辑虚拟主播音视频,一键生成蒙古语音视频智能播报。
  该AI合成主播采用蒙古语语音合成、蒙汉机器翻译、人脸关键点检测、人脸特征提取、人脸重构、唇语识别、手势姿态合成等多项前沿技术,并结合语音、图像等多模态信息进行建模训练后,生成与真人无异的蒙古语AI分身模型,进而提高信息表达和传递的效率。
  蒙古文信息处理技术重点实验室主任高光来介绍,奧云AI合成主播主要基于蒙古文人工智能平台,该平台可以一站式解决蒙古文信息处理需求,传统蒙古文与西里尔蒙古文相互转换的准确率可达95%以上;而蒙古文自动校正功能则可以较好地校正显现形式相同但编码错误的单词,也可以根据上下文正确选择显现形式相同但编码不同的单词。
  高光来表示,蒙古语语音识别、语音合成等系统的成功研发应用,让蒙古语与人工智能接轨,进一步推动了蒙古语在教育、气象、交通等多个领域的运用。
其他文献
本报讯 日前,清华大学金融科技研究所(THUIFR)宣布与Ripple合作,为中国的研究生推出区块链技术研究奖学金计划(BRSP)。据悉,THUIFR成立于 2017 年,本次合作将基于THUIFR的研究资源和成果,BRSP将重点关注国际监管政策和區块链技术的发展。参与该计划的学生将参与有关区块链技术的全球法规和政策的前沿研究。
穿行秦岭南麓,空气变得清凉。群山巍峨,苍翠欲滴,层层绿意映入眼帘,瀑布飞湍掩映其间。   作为秦岭国家公园中心区域,陕西省商洛市柞水县坐拥牛背梁国家级自然保护区和国家森林公园、秦楚古道、柞水溶洞等秦岭风景名胜。近年来,柞水对秦岭实施严格生态保护,使植被覆盖率增至88%,负氧离子每立方米达5万个以上,年均空气质量优良天数达335天以上。   依托好山好水好风光,秦岭山脚下的柞水县群众的生产生活发
燃料电池汽车示范城市申报启动  日前,燃料电池汽车示范城市申报已启动,包括上海、北京、山东、山西等多地已明确申报或出台申报方案。业内普遍预期,随着申报工作的启动,燃料电池“十城千辆”正式文件出台已进入倒計时阶段。从最新申报政策来看,要求根据目标完成情况,对开展燃料电池汽车核心技术产业化攻关和示范应用的入围城市群给予奖励。奖补资金由地方和企业统筹,但不得用于支持燃料电池汽车整车生产投资项目和加氢基础
近日,百度发布了“ACE交通引擎”,以自动驾驶(Autonomous Driving)、车路协同(Connected Road)、高效出行(Efficient Mobility)三者为核心,为国内各大城市提供了一套涵盖智能信控、智能公交、自动驾驶、智能停车等一系列具体应用的智能交通解决方案。目前,新引擎已在北京、长沙等10多个城市落地,并取得了一系列运行成果。  据介绍,百度“ACE交通引擎”采用
近日,据国外媒体报道,宝马重申,为了实现未来的零排放,公司将不仅专注于电动汽车研发,还计划开发氢燃料电池。据了解,第五代eDrive电力驱动系统将配备宝马集团与丰田汽车公司合作研发的燃料电池和宝马集团独立开发的燃料电池组和整體驱动系统。
近日,中国科学院北京分院的研究团队研发出一个AI人像生成模型——“从局部到全局”模型。新模型可以依据简笔画生成逼真的人脸肖像。利用这一模型,没有绘画经验的人也可以很容易地得到逼真图像。除了用于娱乐,未来新模型或能帮助执法人员进行嫌疑人画像。  这项研究发表在学术网站arXiv上,论文标题为《深度人脸画像:从草图深度生成人脸图像》。  据介绍,共有60名参与者(39男21女,年龄介乎18至32岁)参
近日,广州码上吃饭网络科技公司与安徽金源信息网络科技公司在广州南沙举行战略合作签约仪式,双方表示将根据各自的战略布局及资源优势,将新型物联网智能碾米机在安徽全区域迅速铺开。双方计划未来3年将铺设1万台设备,为安徽百姓的碗中添上新鲜营养的现碾大米。  据悉,新型物联网智能碾米机是一种通过自助服务、自主结算,对稻谷即时加工,以无人值守的智能零售终端形式进行现碾米销售的新业态。此次合作,双方将深入开展技
本报讯 7月3日,国际通信标准组织3GPP宣布R16标准冻结,标志5G第一个演进版本标准完成。  据了解,3GPP是国际通信标准组织,全球5G技术的标准制定也有赖于该组织。该组织主要由3个技术规范组(TSG)组成,分别是无线接入网(RAN)、业务与系统(SA)和核心网与终端(CT)。2018年,3GPP已经冻结了5G第一版R15。而本次冻结的R16,实现了从“能用”到“好用”,围绕“新能力拓展”“
3月31日,中科视拓宣布,開放SeetaFace6人脸识别算法。此前,中科视拓分别开源了SeetaFace1.0人脸识别引擎和SeetaFace2.0商用级人脸识别算法。SeetaFace6是最新开放的正式级商业版本,突破了之前社区版和企业版错开发布的情况,此次v6版本与商用版本同步推出。  SeetaFace6包含人脸识别的基本能力:人脸检测、关键点定位、人脸识别,同时增加了活体检测、质量评估、
据国外媒体报道,由于欧洲严格的排放标准,为避免处罚,2020年,奔驰预计将欧盟地区的纯电动车、插电式混合动力车型销量占比增加三倍。  产品部分,除EQC以外,奔驰还有望推出EQS、EQB、EQA等純电动车型。  按照规划,截至2022年年底,奔驰将推出10余款纯电动车型。