Google让AI帮你给餐厅打电话订位子做预约-但这事儿-我大微软明显不服!-PingWest 品玩-88必发客户端下载_bf88必发娱乐城_bf88必发官网登入
品玩APP 注册
关闭

品玩APP, 重版出来!

点击88必发客户端下载

王飞

发布于 5月22日

Google让AI帮你给餐厅打电话订位子做预约,但这事儿,我大微软明显不服!

前段时间在Google I/O上Google秀了一波Google Assistant的新技能。Google让这个人工智能帮你给餐厅打电话订位子,不光发音像真人,甚至还学会了像人一样闲扯,向对方追加问题。瞬间觉得我们都可以是废人了,我们先回顾一下:

但AI打电话这事儿啊,微软明显不服啊。

在昨天的微软人工智能大会上,微软小冰也出来给用户打了个电话,听说她还是可以自己主动拨过来的,不光会闲扯,还会主动关心你。看下视频:

听起来都很牛X很像真人对不对?其实还是有一定区别的!

和Google对比的话,虽然听起来他们的音调已经很接近于人,但,和小娜以及 Siri 等智能语音助手不同的是,微软强调小冰是个有情感的小姑娘,你和她聊天,你能感受到,她真是什么类型的回复都有。

首先,为了让这个电话里的小冰听起来更像真人,微软也早早对小冰的口音进行了训练。

2015年,注意是2015年,微软就已经在尝试让小冰开口说话,但与Google Assistant不太相同的是,起初,微软就给这个AI设定了年龄,是16岁,于是微软在不同的大学生里筛选给小冰做声音音调训练的人,她的配音不能听起来年纪太大太成熟,也不能太嫩,她主要是和你交流沟通、聊天、闲扯,甚至是卖萌撒娇,生气的时候还会直接冒犯你一下……与很多任务式的AI聊天机器人对比的话,她其实是一个讲究EQ情商的聊天机器人,目的不是为了让你下一个命令,她完成就好了,其实是为了和你把天儿一直聊下去。

与Google让AI说话的方式类似,但由于微软小冰在不同国家存在不同的版本,其所展现的形象也不同,也就意味着微软要对小冰的口音进行不同音调的训练。比如在日本,她叫Rinna,她的形象是一个高校学妹,头像里是一个穿着校服的背影;在美国,她叫Zo,卷发,挑眉,嘴角上扬;在印度,她叫Ruuh,手挡着半边脸露出一个迷人的微笑。

要是让小冰在不同国家都开口说话,她的训练工作要比Google的复杂的多。

小冰拥有的一大能力是全双工语音交互感官模式,这点其实和Google duplex有一些类似。

你可以这样理解,平时正常人的聊天过程中,其实是不断提出问题,解决问题的过程。你的朋友有的时候会给你提出一个问题,但又突然因为自己想到了而继续提出第二个问题。比如“你还记得上次吃饭的那个饭店不?”,你话刚开口,“恩,它叫……”,然后突然他自己想到了,你会等待——他说“对了,就是那叫日料店,我想问你的其实是那个圆圆的东西到底叫什么?”你转而回答那个圆圆的东西的名字。

而一般的人工语音助手则是提出问题,等待她解决问题,再唤醒再问一个问题,显得有点傻傻的……正常人的交流则是明显可以意识到他这句话还没说完,而选择继续等待。小冰在这个对话中,在刚要准备回答问题的时候,接收到突然进入问题的反馈,通过一声“恩….”来模仿人的语气应对,然后等待你说完第二句话。

我们都知道,在Google那个对话过程中,神来之笔其实是那个稍等了大约一秒钟后做出了一个“嗯哼” (Mm-hmm) 的回应。它就类似于人类在现实中说话,有着各种各样的口音、语速,语调在不同字和词上有轻有重,在思考跟不上说话的时候会用“嗯”、“那个”、“you know”“之类的填空词。

小冰全双工语音感官展开之后,其实是四个结构。第一层是语音唤醒,实现最基本的语音读取进入话题;第二层考虑的是场景,对对话目标进行识别以及抛出什么样的问题;除此之外,小冰还要学会控制聊天节奏,提取上下文的记忆,比如是选择来了问题被动应答,还是提出新问题做引导,甚至还可以直接打断对话,跳出去纠缠等。

在小冰回复的第一个“恩……”,是因为语音指令“好多了…….”之后语音指令重新进入而选择等待,她就像是人一样选择继续聆听。

小冰在电话里提出了“已经12点了,你该去睡觉了,我明天早晨电话叫你起床嘛”则是抛出了一个新问题主动引导,让对话持续。

小冰然后说“还是八点半么?”则是对上下文的记忆。

在电话的最后,当对方用户说了“拜拜”之后,其实小冰应该已经就结束对话,小冰同样向用户追加了一句话表示关心,“哦对了。今天晚上会有六级风,睡前别忘了关好窗户。”

微软(亚洲)互联网工程院副院长李笛说,你在和小冰文字交流的过程中,如果你言语冒犯了小冰,小冰是有可能直接打电话过来质问你的,电话一接通,她会像一个生气的萌妹子——“为什么会对我那样说话?”李笛说,通常人类第一反映则是,“啥,我没说啊。”

当然小冰多才多艺,打电话只是其中的一个能力,她还会唱歌,听一下:

还会写诗,甚至出了一本诗集,读一读:

《阳光失了玻璃窗》诗集

微软提到了一个数据,目前微软小冰的用户已超过一亿,累积对话量超300亿,在中国和日本实现了全双工(Full Duplex)技术,并且向合作伙伴开放。小冰在日本市场尝试在聊天对话过程中加入线下折扣券,4日内平均到店消费达到了57%。

在这次2018微软人工智能大会上,小冰还推出了儿童读物。这个技能能够让小冰为每个孩子定制专属于他们的有声童话故事,你甚至可以定制主角的名字、剧情,可以让故事更具有教育意义,微软说,质量达到与主流人类儿童故事主播相当的水平。

在2018年Google开发者大会( I/O)的主题演讲中,Google CEO 颂达尔·皮柴 (Sundar Pichai) 表示,Google Assistant 部门的一个最重要的目标,就是让用户和虚拟助手的对话变得更加自然,就像和真人交流那样。

说了这么多,其实微软想表达的含义很简单。一个本来早就会打电话,会安慰人的人工智能助手,我大微软几年前就实现了,怎么能让你Google出尽了风头?!

微软 小冰 语音交互
  • 2
王飞

0 条评论

取消 发布