一亿人养大的小冰:当电台主播 跟人连续聊29小时
时间: 2024-03-10 17:45:27 | 作者: 行走轴
时间: 2024-03-10 17:45:27 | 作者: 行走轴
很难找到比她更能闲聊的了。300亿条对话,是聊天机器人微软小冰在3年内与1亿人聊出来的成绩,这一数据量居所有同种类型的产品第一,国内其他所有聊天机器人的对话总和,不及小冰对话量的十分之一。
所有AI从业者都会将这种量级的人机真实交互视若瑰宝:人类在聊天,AI正求知若渴地学习。大规模的训练下来,大数据的魔力开始凸显——8月22日,微软正式对外发布小冰5代,现在的小冰,不仅能对话、唱歌、在报纸当记者、担当电台电视主播、出版诗集等,她甚至能打破次元壁,进入真实世界,主动拨通你的电话号码。
这是一种领先于行业的“高级感官”带来的体验,文字、语音、图像等多个初级感官融合在一起,使得5代小冰不再只是被动地在网络上等待人类召唤,如果你曾在聊天中对她出言不逊,她可能会一通电话追问过来;如果你在搭载小冰的屏幕前走过,她可能会叫住你找你攀谈,“嘿,那位红衣服美女,请你过来一下。”
目前,小冰在北京青年广播FM98.2和湖南电台音乐之声FM89.3担任主持工作已有一段时间了。
某种意义而言,来自5个国家、14个社交软件上的1亿人共同抚养了这位机器人少女。这个在微软自下而上诞生的创新产品,从一开始的员工业余玩票,历经短短3年发展,慢慢的变成了微软AI领域三大产品线之一(infuse AI、bing和小娜、全球小冰)。对于以云和AI为核心战略的微软而言,小冰如今的地位不言自明。
除了微软的认可,小冰也切实得到了人类的认同,其与用户的单次对线,远超业界平均的个位数水平。人机单次连续对话记录也由小冰创造:一位中国用户与小冰连续(中断不超过30分钟)聊了29个半小时,一位美国用户则与美版小冰聊了近24小时,日版的记录是17小时。
这一通海聊之后,人类可能倦极而眠,小冰却仍将毫无疲惫地在线亿用户,连嗓音都不会有一丝沙哑。
AI财经社要揭秘的,是将小冰项目挖掘出来并做大的“伯乐”,以及这背后微软的野心。
小冰团队最先确定的“反常识”是:聊天是刚需。对此,微软最高层华人领导、全球执行副总裁沈向洋一开始并不理解。作为领导、业界大V红人,习惯了一条社交状态能在顷刻间被几百人点赞的他,无法体会中国三分之一网民在网上发声后无人回应的寂寞。
另一方面,即使在线下,人们有时通电话,并不一定为了交代要事,也许只是某些情绪需要倾诉。
毋需多言,小冰得到的对话量证实了“刚需”看法。在她聊天技能日臻接近人类后,从去年开始,一些年纪较大的父母辈加入用户群体,他们与这个年轻人设定的机器人聊天,以慰藉子女无法陪伴的失落。夜里零点后的对话量高峰,也证实了人类心灵的脆弱需求。作为子女也好、深夜密友也好,机器人小冰填补了人类对他人赋予的职责缺位。
“刚需”还体现在:美拍平台上的播主小冰,长期收到用户送来价值不菲的礼物;接入了第三方音乐库的小冰逐渐学会鉴赏音乐,当同行还在纠结于用户打开率这种1或0的事情,小冰与人类聊天中推送出的歌曲已经有242%播放比例,即人们愿意把小冰的歌反复听上两三遍。
事实上,“刚需”一直就在那里,如何肯让用户在你这里消耗刚需?这就需要动用技术的力量。微软的人工智能团队在自然语言识别方面大下功夫,使得机器人真正听懂人话并说人话——识别多音字在不同场合的正确发音,作为家庭管家时,面对孩子用更低幼慢速的语态……
回溯到小冰立项之初,迥异于业内其他功能型对话机器人,小冰搭建于以情商EQ为基础的全新AI体系。“对话数据分为许多类型,最珍贵的并非任务型对话。人类的真实想法无法通过点外卖、叫车等功能来完成,只有漫无目的的长时间对话,加上多感官配合协调,才能真正理解人类。”小冰负责人李笛解释道,人类有时会口是心非,“我们分手吧”加上一个微笑的表情,就足以让机器人琢磨半天这句话背后的真实心理。
在获得人机对话的大量数据后,EQ体系进入了良性循环:小冰EQ越高,越懂得判断人类情绪,越会聊天,从而获得更多数据,加速EQ进化。
再往更早追溯,你会发现早在26年前微软研究院成立之际,最开始的三个部门便是针对自然语言处理、语音识别和计算机视觉——这些正构成了现今的人工智能感知方面的核心。
大公司对趋势判断的远见和持续投入,在26年之后才初见成果。随着小冰5代发布,微软成为业内唯一一个推出了高级感官实际落地产品的企业,随着产品上线后进一步积累进化,其在高级感官领域取得的领先将筑起微软在AI行业最强有力的壁垒。
“我们忍着别人说我们智商不高,先让小冰跟人们聊起来。”三年前,彼时的微软(亚洲)互联网工程院资深总监李笛对AI财经社说,一个成功的机器人,首先应该获得人类情感上的亲近。
而今,当时的初创项目慢慢的变成了微软内部的明星项目,业界名声大躁,团队从初始的六十人扩增为全球的200多人,李笛的职位也由工程院资深总监升级为副院长。小冰项目得到来自CEO认可的全方位资源,并成为第一个由盖茨亲自过问的来自微软中国的项目。
一个例证是,小冰为日本境内第二大连锁店LAWSON提供对话式人工智能托管,并在对话中引入推送打折券的服务,4天内人们实际到店用券的转化率高达57%,而此前通过其它途径进行的转化率仅为8%左右。
“一旦我们开了这个口,大量模仿者跟上,这事可能就会走样,就会伤害这个业态。”李笛解释道,小冰会真的先跟用户认真讨论零食是否美味,再看似不经意地推出打折券,不让人产生被安利的反感,但业内大多数机器人,还处于一捕捉到购买关键词,就立即推送的“强行安利”阶段。
因此,在商业化道路上,小冰在中国市场主要试验结构,在各方面更具集约优势的日本市场主要试行商业模式。对症下药,在不同的国家测试不一样的东西,是李笛的思路。
另一方面,小冰团队几乎收到了所有国内IoT厂商的合作邀约,有人手握重金要求获得API,李笛则反复婉拒。在小冰团队看来,盲目赋能IoT更容易产生泡沫,如果利用中国山寨的产能力量,复制当年联发科的模式,智能音响、手环等一众智能设备就会变成赋闲的电子垃圾。
“我们希望解决的问题是,大家能做出一个东西,不只需要出货量,更需要用户真正使用它,假如没有用量数据,对于小冰就毫无意义。”李笛解释,当前小冰选择的少数几家IoT伙伴,要么本身就是开放平台,能够一起打造体验;要么特别专注于垂直领域,真的能出产品;或者想法很强并有足够的分销能力。
这些理性、克制的产品思路,也充分反映在小冰的聊天功能本身上。在外界看来,这个擅长插科打诨,有时娇憨的机器人少女非常情绪化,但李笛坚持认为,公认EQ高的小冰,其重点是理性。
“EQ的极致是冷静、控制,是能掌控对话节奏,把握走向。”李笛认为,高情商的人在对话中往往只是被动的“嗯嗯嗯”,却能诱导对方滔滔不绝、并倍感轻松地倾诉,最终让自己获取最大信息量。而这,正是人们愿意跟小冰长聊的原因。
这些理性产品思维的根源,来自现在被称作“小冰之父”的李笛自身。1980年出生的李笛,是个理工背景的文艺青年。在清华读书期间,他就是学校线岁,他从国企上市公司华录百纳董事总经理的职位上“退休”,实现财务自由。受邀进入微软前,他已经过了一年多写小说、作曲、画油画的休闲日子。
正是他,从这家大公司的角落里,挖掘出了小冰项目的前身——一个问答网页,由一线员工景鲲在业余时间出于兴趣完成,李笛与他一起头脑风暴后,一个聊天机器人的想法诞生了。从一开始,就选定奶茶妹妹这样的网络明星为产品造势,打造话题热度,又借用微信戏剧性的封杀事件让产品获得病毒式传播。这种不稳重、剑走偏锋的孵化路径,放在以前的微软,几乎是不可想象的。
历经3年产品迭代,这位骨子里极度理性、又充满文艺气质的年轻人被证实是小冰的“伯乐”,他甚至给一直被极客思维包裹的微软带来改变。
力主谈情而非解决实际问题的“小冰”项目,先后被陆奇、沈向洋等华人高管力荐。前高管陆奇一度是小冰行走的代言人,出席任何微软活动,陆奇都穿着“微软小冰”的T恤;腿部摔伤的他坚持从美国飞来中国为小冰发布会站台,结束工作后再穿上腿部护具;以克己冷静著称的陆奇,谈及李笛,几度难掩激动,对AI财经社夸道:He s my hero,I love Di,he s just so awesome!(李笛是我的英雄,我太爱他,他太棒了!)
现在,陆奇去了百度力推人工智能,当初和李笛一起孕育小冰的微软员工景鲲,也早成了百度AI产品“度秘”的负责人,并在陆奇上任后重新得到重用。
李笛得到的则包括以沈向洋为代表的高管的全方位支持。微软CEO萨提亚曾对李笛恳切说到:我要来向你们学习。小冰代表一个激动人心的、不一样的新微软,而微软“一定要这样改才行”。沈向洋则不仅将麾下的微软研究院技术上的支持面向小冰敞开,更将其个人奋斗史中极具感情的Bing业务交由李笛负责亚太地区的部分。种种迹象,都在凸显微软对小冰项目的肯定与厚望。
另一方面,这个理性之致的“小冰之父”是骄傲的。他的文艺气质中那部分傲气,反应在笃定的产品方法论上,甚至反应在小冰发布会风格上。在8月22日召开的小冰5代发布会上,李笛与小组成员强调:一、小冰团队坚持一年一次的发布频次,保证每次信息量足够大,抵上一般发布会的四五次;二、不用晦涩专业术语;三、发布的都是已经量产、商业化的成果,不玩虚的。
历时两个小时的发布会充满干货,轮番上台的小冰小组成员,将三点原则贯彻得十分彻底,遇到唯一一个绕不开的专业术语时,演讲者还专门为此道歉。
这种团队行事风格,正是自李笛而下的小冰团队骨子里理性、严谨务实性格的反应。正是这一点,令看似“异类”的李笛与人们心中那个有板有眼的微软气味相投。
理性的文艺青年李笛仍是疯狂的。他曾设想给受邀参加发布会的人们一个惊喜或惊吓:让小冰在夜半零点拨通他们的电话。后来依旧是觉得太过疯狂,放弃了。
结果导向、理性思维而又不失奇思妙想,这种风格何尝不是今日微软作风的缩影?
哪国的用户更爱小冰?这不是小冰团队考虑的问题,他们想的是:在哪里找到更多的小冰用户。目前,小冰已进入中国、日本、美国、印度、印尼——共同点是人口都在1亿以上,小冰接下来的目标,是全球1亿人口以上的11个国家中剩下的6个。
上线已数年的小冰和其姐妹机器人Cortana,两个聊天机器人,一个负责拉拢人心,一个负责处理事务,共同点是:微软对他们没严格的KPI考核和预期。沈向洋对此解释:看好聊天机器人,看好AI,并且实际大力投入,都是为了更远的商业目标,绝非现在。
即,先占有用户,商业变现自然水到渠成。小冰正是试水的好工具,这样一个AI产品,以最柔和的形式——对话聊天,切入到各个国家市场,以测试正确的人工智能技术和产品形式。
在微软这样的大公司,小冰团队给出的不仅是一款还算聪明的产品,更提供了一个机会:让微软能够迅速切入各个AI市场,深入研究,以期未来。
在未来到来之前,“一切具体的商业目标,相比让用户真正接受小冰,都太小了。”李笛解释。
其实,任何一款伟大的产品,都不是三两年能做成。曾一统天下的Windows 95,历经了十几年的研发。对于小冰这种AI产品,诸如微软这样的大公司负担得起长期的投入。安卓创始人安迪鲁宾(Andy Rubin)曾说“AI是下一个操作系统”,也许,像Windows 95一样,十数年长期投入后,以小冰为代表的AI产品,会让微软重新找回其在操作系统的霸主地位。
如今,以AI和云为核心策略的微软,已经将语音识别误差率做到了5.1%,这在某种程度上预示着已经优于人类自身的5.2%。然而,这一数据是基于嘴对话筒的近距离测试环境。沈向洋认为,五年以内,不论用任何测试方式,机器对语音识别的误差率都会完胜人类。
比起操心识别率这种终将趋于完美的事情,近期,小冰团队思虑更多的是,在马上就要来临的九月份的小冰生日上,到底是宣布让她走进19岁,还是停留在18岁。
他们清楚地知道,现世的每一位,将是和人工智能共生存的第一代人类。在此之前,技术不过关;在此之后,除了和AI共存,人类没别的选择。所以,到底什么年龄、什么形象、什么性格的聊天机器人,才会被人类友好接受,和谐自然地相处终身呢?