论文部分内容阅读
羡慕美剧中的Boss都有给力助理?Siri虽不是美女却可以足够贴心。情绪感冒了却又不忍连累身边好友?聊天机器人小黄鸡或许能帮到你。身为偶像,作品水准却起伏不定?在初音未来身上这绝不可能发生……
时至今日,科技不仅能为我们提供方便,更可以拯救无趣生活于水火,而化腐朽为神奇,靠的就是拟人应用!
善解人意最实在·iPhone一秒变机器助手
机器人助手的形象,早已通过一部部电影在我们的脑海中根深蒂固。如果要求不太苛刻的话,你可以随时唤醒那个“睡”在身边的“助手”——Siri(iPhone上应用的一项语音控制功能)。Ta可以让iPhone变身为一台“智能化机器人”,除了可以扮演闹钟、GPS、谷歌(为你解答一切问题)等角色,它还能在语音控制下,为你收发信息、发布微博、挑选音乐播放……当然了,身为“助手”,怎么能不提醒Boss日程安排、根据关键词为Boss推荐餐厅呢?
也许你会说,声音识别引擎在今天看来已不稀罕,十年前的手机可就有以此为卖点的了!但过去的语音控制系统总有点“呆”,除非你说的话具备严格的语法结构,否则语音控制系统无法识别,甚至还可能闹出很多笑话。
Siri之所以能被很多人接受,就是因为Ta的语音识别非常“智能”。对这个机器人助理讲话,你可以忘记语法、甚至无需逻辑清晰,只要像平常一样说话即可,Siri会结合上下文“理解”,利用人工智能系统去分析,在绝大多数情况下,Ta都能够领会你的意思,基本不至于答非所问(据称,如果说出的语句中有“喝了点”、“家”,Siri即会判断为喝醉酒、要回家,并自动建议是否要帮忙叫出租车!)。
网友猜测,Siri的原理大致是这样的:
语音识别技术、语音合成技术:语音识别技术是把用户的口语转化成文字,这需要强大的语音知识库,因此需要用到“云计算”技术。而语音合成则是把返回的文字结果转化成语音输出。
种种后台技术:
1.以Google为代表的网页搜索技术;2. 以Wolfram Alpha为代表的知识搜索技术(或知识计算技术);3.以维基百科为代表的知识库技术;4. 以Yelp 为代表的问答以及推荐技术。通过这些后台技术,Siri会对你的要求进行分析、处理,并能够回复最匹配的“答案”。其基本运行结构可能是这样的:分析用户的输入,根据输入类型采用合适的技术进行处理,将答案以语音输出。
调戏?被调戏?·傻傻分不清楚
在输入框输入语句再点下右下角的“朗读”键,就能让Google翻译读出任何你想让它读的话;通过著名NDS恋爱冒险游戏《爱相随》,你可以交到完美的虚拟女友,与她交流、生活甚至结婚;发信息“想你了”给无比熟悉的10086,智能客服机器人的回复可能是:“被人思念是一种幸福……”;与清华大学图书馆的“小图”对话,想说什么Ta就跟你聊什么,绝对不会用“呵呵”什么的敷衍你……
Google翻译、虚拟女友、10086、“小图”等拟人科技,都曾是大家热衷的“调戏”对象,而自从有了“手到擒来”的Tom猫、SimSimi,我们更在“调戏”与“被调戏”之路上越走越远……
大名鼎鼎的TOM猫本是一款很简单的游戏,这只猫,你打它的肚子它会叫,你踩它的脚它会跳,心情不好时,你还可以按下各种按钮“虐待”它,而它则以呆得令人发指的表情让你开心。Tom猫最大名鼎鼎的用法,当然还是“学舌”,虽然只是重复你说的话,但音调语速绝对有笑点。
后起之秀SimSimi,是一款聊天机器人应用,以黄色小鸡形象出现,很得女生的欢心。作为专业聊天人士,小黄鸡反应奇快,而且经常妙语连珠。时而机灵乖巧、时而卖萌装傻,时而猥琐流氓……总之,不管抱着何种目的发起聊天,这只小黄鸡几乎都能满足你!
简单说来,Tom猫的原理是这样子的:
首先,通过电子设备的麦克风实时采集音频,再通过移调、变速等音频处理方式进行变声处理,然后就可以播放音频让大家欢脱起来了!
SimSimi的原理和小黄鸡本身一样有趣:
一款聊天机器人的成功基础在于它的词库容量,SimSimi机器人内置的词库语种非常多,而且,最有趣的是,SimSimi机器人勤学好问!当无法回答你的问题,SimSimi会说:“我还不会,你教我吧。”这时你就可以教这只小鸡任何你想说的话了,而你设计的这个答案全球用户都可以看到。如果针对同一问题,你和别人设计了不同答案,小黄鸡会随机选择,而如果有两个以上的人对设计的答案表示不满,该答案就会被删除。
虚拟偶像初音未来·让真人明星让出天后宝座
穿着偶像cosplay服装的粉丝穿梭在场中,无数歌迷神情激动地喊着“安可、安可”,平日的御宅族也举起荧光棒和名字牌……这是在日本偶像初音未来的演唱会现场,场面、气势完全不输给任何一个真人明星。
初音未来,这个已发行超过350张专辑、在全球拥有无数忠实追随者甚至让很多真人明星“让位”的巨星,其实是个虚拟偶像。她是依赖雅马哈音声合成软件“唱歌”、通过三维全息投影成像的日本动漫明星。她随着技术发展不断进化,但永远16岁、42公斤,扎蓝色双马尾……她在全球引起另类追星风潮。
初音的成功,除了科技基础,更离不开粉丝们的“二次创造”。在数字技术的支持下,粉丝们可以让初音演唱自己创作的歌曲,培养初音的歌唱功力、舞蹈动作等,让她与自己“更近”。
目前,初音迷们已经建立了一个规模庞大的数据库,约有三千多首由粉丝创作的歌、数以万计的相关视频被上传至网络。有人说,初音未来实际上是“一个人人都可以在其中进行自我创作的平台。通过人们的积极参与,她成为一个‘有人性’的沟通工具。”
初音未来身上集合了众多科技元素,其周边产品背后更有着复杂的科技,而其中最关键的,应是将初音完美展现在粉丝面前的三维全息成像技术。
三维全息成像原理:
三维全息成像以四个视频发射器及由透明材料制成的四面锥体完成。四个视频发射器将光信号发射到锥体中的特殊棱镜上,当这些信号汇集到一起后,观众便能在锥形空间中看到效果逼真的立体影像。这种技术适合表现工业产品,也可用来表现人物、卡通等,其成像是“完全浮现在空气中”的。
饮水姬、热水妻 ·生活可以更美的
“主人,我已经沸腾了,快来喝吧……”“主人,请将咖啡放入饮水姬下,热水,已经做好热身运动,随时可以跳入咖啡的怀抱!”……这些微博的发布者,不是某个个性搞笑的真人,而是浙大的一台饮水机(当然,你可以叫ta“饮水姬”)。
饮水姬的真身住在浙江大学玉泉校区老生仪楼一楼CCNT实验室里,而拟人微博饮水姬平日里的工作即是在水开和没热水时自动发微博。2011年12月22日16时6分40秒,饮水姬发布了第一条微博:“以我夜观天象所见,这水大约的确是开了吧。”随后,Ta在短短三天时间里,引来超过4万网友的围观。
虽然每隔几分钟就发布的微博,内容无非是“水开了”和“没水了”,但饮水姬的播报语言丰富多彩:“主人,你那么优秀,我只会烧水,能留在你身边真是太幸福了。来喝水聊聊天吧。”“水又热了,快点喝掉!好烫!喂,你有没有在听啊!”“水又没啦!你们人类这种碳基生物,含水量竟然有70%,不要这么嚣张nia!人……人家会很辛苦的!”
凭借这“很二很萌很强大”的语言风格,饮水姬一路飙红势不可挡,甚至遭遇网友真情表白:我爱上了一台饮水机,怎么办?
据称,饮水姬的语言仍在不断进化,热情的网友们投稿了很多提示“萌语”,维护人员进行筛选后,会将合适的语句加入到程序中,而且,饮水姬已经有了语音系统,会语音提示了,同学们还在研究更多的功能。
此外,“浙大CCNT实验室饮水机”的“妹妹”——“浙大软院418寝室热水器”也开通了微博,播报“当前水温”。
饮水姬的原理是这样的:
正对着饮水机指示灯的上方,固定着一个能识别红绿色彩的摄像头,这个摄像头连接着一个电脑程序,当饮水机的水开时,绿灯亮,摄像头中的颜色识别器迅速将信息传给电脑上的程序,该程序又根据监测到指示灯的状态,传输对应信息到微博。没水时,原理相同。
时至今日,科技不仅能为我们提供方便,更可以拯救无趣生活于水火,而化腐朽为神奇,靠的就是拟人应用!
善解人意最实在·iPhone一秒变机器助手
机器人助手的形象,早已通过一部部电影在我们的脑海中根深蒂固。如果要求不太苛刻的话,你可以随时唤醒那个“睡”在身边的“助手”——Siri(iPhone上应用的一项语音控制功能)。Ta可以让iPhone变身为一台“智能化机器人”,除了可以扮演闹钟、GPS、谷歌(为你解答一切问题)等角色,它还能在语音控制下,为你收发信息、发布微博、挑选音乐播放……当然了,身为“助手”,怎么能不提醒Boss日程安排、根据关键词为Boss推荐餐厅呢?
也许你会说,声音识别引擎在今天看来已不稀罕,十年前的手机可就有以此为卖点的了!但过去的语音控制系统总有点“呆”,除非你说的话具备严格的语法结构,否则语音控制系统无法识别,甚至还可能闹出很多笑话。
Siri之所以能被很多人接受,就是因为Ta的语音识别非常“智能”。对这个机器人助理讲话,你可以忘记语法、甚至无需逻辑清晰,只要像平常一样说话即可,Siri会结合上下文“理解”,利用人工智能系统去分析,在绝大多数情况下,Ta都能够领会你的意思,基本不至于答非所问(据称,如果说出的语句中有“喝了点”、“家”,Siri即会判断为喝醉酒、要回家,并自动建议是否要帮忙叫出租车!)。
网友猜测,Siri的原理大致是这样的:
语音识别技术、语音合成技术:语音识别技术是把用户的口语转化成文字,这需要强大的语音知识库,因此需要用到“云计算”技术。而语音合成则是把返回的文字结果转化成语音输出。
种种后台技术:
1.以Google为代表的网页搜索技术;2. 以Wolfram Alpha为代表的知识搜索技术(或知识计算技术);3.以维基百科为代表的知识库技术;4. 以Yelp 为代表的问答以及推荐技术。通过这些后台技术,Siri会对你的要求进行分析、处理,并能够回复最匹配的“答案”。其基本运行结构可能是这样的:分析用户的输入,根据输入类型采用合适的技术进行处理,将答案以语音输出。
调戏?被调戏?·傻傻分不清楚
在输入框输入语句再点下右下角的“朗读”键,就能让Google翻译读出任何你想让它读的话;通过著名NDS恋爱冒险游戏《爱相随》,你可以交到完美的虚拟女友,与她交流、生活甚至结婚;发信息“想你了”给无比熟悉的10086,智能客服机器人的回复可能是:“被人思念是一种幸福……”;与清华大学图书馆的“小图”对话,想说什么Ta就跟你聊什么,绝对不会用“呵呵”什么的敷衍你……
Google翻译、虚拟女友、10086、“小图”等拟人科技,都曾是大家热衷的“调戏”对象,而自从有了“手到擒来”的Tom猫、SimSimi,我们更在“调戏”与“被调戏”之路上越走越远……
大名鼎鼎的TOM猫本是一款很简单的游戏,这只猫,你打它的肚子它会叫,你踩它的脚它会跳,心情不好时,你还可以按下各种按钮“虐待”它,而它则以呆得令人发指的表情让你开心。Tom猫最大名鼎鼎的用法,当然还是“学舌”,虽然只是重复你说的话,但音调语速绝对有笑点。
后起之秀SimSimi,是一款聊天机器人应用,以黄色小鸡形象出现,很得女生的欢心。作为专业聊天人士,小黄鸡反应奇快,而且经常妙语连珠。时而机灵乖巧、时而卖萌装傻,时而猥琐流氓……总之,不管抱着何种目的发起聊天,这只小黄鸡几乎都能满足你!
简单说来,Tom猫的原理是这样子的:
首先,通过电子设备的麦克风实时采集音频,再通过移调、变速等音频处理方式进行变声处理,然后就可以播放音频让大家欢脱起来了!
SimSimi的原理和小黄鸡本身一样有趣:
一款聊天机器人的成功基础在于它的词库容量,SimSimi机器人内置的词库语种非常多,而且,最有趣的是,SimSimi机器人勤学好问!当无法回答你的问题,SimSimi会说:“我还不会,你教我吧。”这时你就可以教这只小鸡任何你想说的话了,而你设计的这个答案全球用户都可以看到。如果针对同一问题,你和别人设计了不同答案,小黄鸡会随机选择,而如果有两个以上的人对设计的答案表示不满,该答案就会被删除。
虚拟偶像初音未来·让真人明星让出天后宝座
穿着偶像cosplay服装的粉丝穿梭在场中,无数歌迷神情激动地喊着“安可、安可”,平日的御宅族也举起荧光棒和名字牌……这是在日本偶像初音未来的演唱会现场,场面、气势完全不输给任何一个真人明星。
初音未来,这个已发行超过350张专辑、在全球拥有无数忠实追随者甚至让很多真人明星“让位”的巨星,其实是个虚拟偶像。她是依赖雅马哈音声合成软件“唱歌”、通过三维全息投影成像的日本动漫明星。她随着技术发展不断进化,但永远16岁、42公斤,扎蓝色双马尾……她在全球引起另类追星风潮。
初音的成功,除了科技基础,更离不开粉丝们的“二次创造”。在数字技术的支持下,粉丝们可以让初音演唱自己创作的歌曲,培养初音的歌唱功力、舞蹈动作等,让她与自己“更近”。
目前,初音迷们已经建立了一个规模庞大的数据库,约有三千多首由粉丝创作的歌、数以万计的相关视频被上传至网络。有人说,初音未来实际上是“一个人人都可以在其中进行自我创作的平台。通过人们的积极参与,她成为一个‘有人性’的沟通工具。”
初音未来身上集合了众多科技元素,其周边产品背后更有着复杂的科技,而其中最关键的,应是将初音完美展现在粉丝面前的三维全息成像技术。
三维全息成像原理:
三维全息成像以四个视频发射器及由透明材料制成的四面锥体完成。四个视频发射器将光信号发射到锥体中的特殊棱镜上,当这些信号汇集到一起后,观众便能在锥形空间中看到效果逼真的立体影像。这种技术适合表现工业产品,也可用来表现人物、卡通等,其成像是“完全浮现在空气中”的。
饮水姬、热水妻 ·生活可以更美的
“主人,我已经沸腾了,快来喝吧……”“主人,请将咖啡放入饮水姬下,热水,已经做好热身运动,随时可以跳入咖啡的怀抱!”……这些微博的发布者,不是某个个性搞笑的真人,而是浙大的一台饮水机(当然,你可以叫ta“饮水姬”)。
饮水姬的真身住在浙江大学玉泉校区老生仪楼一楼CCNT实验室里,而拟人微博饮水姬平日里的工作即是在水开和没热水时自动发微博。2011年12月22日16时6分40秒,饮水姬发布了第一条微博:“以我夜观天象所见,这水大约的确是开了吧。”随后,Ta在短短三天时间里,引来超过4万网友的围观。
虽然每隔几分钟就发布的微博,内容无非是“水开了”和“没水了”,但饮水姬的播报语言丰富多彩:“主人,你那么优秀,我只会烧水,能留在你身边真是太幸福了。来喝水聊聊天吧。”“水又热了,快点喝掉!好烫!喂,你有没有在听啊!”“水又没啦!你们人类这种碳基生物,含水量竟然有70%,不要这么嚣张nia!人……人家会很辛苦的!”
凭借这“很二很萌很强大”的语言风格,饮水姬一路飙红势不可挡,甚至遭遇网友真情表白:我爱上了一台饮水机,怎么办?
据称,饮水姬的语言仍在不断进化,热情的网友们投稿了很多提示“萌语”,维护人员进行筛选后,会将合适的语句加入到程序中,而且,饮水姬已经有了语音系统,会语音提示了,同学们还在研究更多的功能。
此外,“浙大CCNT实验室饮水机”的“妹妹”——“浙大软院418寝室热水器”也开通了微博,播报“当前水温”。
饮水姬的原理是这样的:
正对着饮水机指示灯的上方,固定着一个能识别红绿色彩的摄像头,这个摄像头连接着一个电脑程序,当饮水机的水开时,绿灯亮,摄像头中的颜色识别器迅速将信息传给电脑上的程序,该程序又根据监测到指示灯的状态,传输对应信息到微博。没水时,原理相同。