谷歌大脑是如何炼成的:万字无删减版全解密(一)
雷锋网按:如果说到在机器学习领域领先的公司,想必你不会忽略谷歌。从谷歌翻译到从机器视觉,谷歌一直努力将机器学习应用于可能想象的任何地方。本文会讲三个故事,它们在 Google 翻译向 AI 的成功转型中整合在了一起:一个技术故事,一个制度故事和一个关于思想演变的故事。本文源自纽约时报,作者Gideon Lewis-Kraus,雷锋网编译,未经许可不得转载。 序:你=你所读的东西在十一月初的一个周五晚上,东京大学人机交互教授 Jun Rekimoto 正在电脑前准备演讲。当他在浏览网页时,Rekimoto 突然发现社交媒体的时间流上出现了一些有意思的内容。虽然这些内容很轻易就看出是谷歌机翻的,但质量已经有了很大的提升。在访问了 Google Translate 并进行测试之后,Rekimoto 惊讶不已。虽然已经夜深,但 Google Translate 的进展之快依然让 Rekimoto 久久无法入眠。 随即,Rekimoto 在他的博客中记下了这一发现。首先,他在 Google Translate 上输入了菲茨杰拉德的代表作《了不起的盖茨比》里的一个英文节选段落,点击翻译后,与两个日文版本(一个是 1957 年 Takashi Nozaki 的版本,一个是现代 Haruki Murakami 的译版)进行对比。Rekimoto 在和我沟通的一封邮件中提到,Murakami 的译文带有强烈的个人风格,用语非常细腻。而谷歌翻译的版本虽然还带着机翻的痕迹,但更加通俗易懂。 随后,Rekimoto 通过日译英对 Google Translate 进行测试。他把自己口头翻译的《乞力马扎罗的雪》的开头部分简单地输入进电脑中,发现翻译结果几乎可与海明威的原作媲美。当然,海明威是以行文通俗易懂闻名的,雷锋网(公众号:雷锋网)也请大家来猜猜,哪一段是 Google Translate 所作,哪段是原版文字呢?
即使对于一个美国土著而言,如果不发现 2 号段落的小小瑕疵,其实很难分辨其中的差别。Rekimoto 表示,其实他对 Google Translate 再熟悉不过了:毕竟在 24 小时前,它只是一个会翻出如下文字的机器:
在 Rekimoto 把测试结果发在有着一万多关注者的 Twitter 后,在短短几个小时内,上千人也 po 出了他们「调戏」机器翻译的结果。有些几乎完美,而有的则啼笑皆非。 在东京破晓之时,Google Translate 就在这一夜攀上了日本推特的头条热搜,甚至把 cult 动画和人气偶像少女组合都挤了下去。每个人都在困惑:谷歌翻译怎么会突然这样让我们眼前一亮? 四天之后,全球的上百名记者、企业家和广告商蜂拥到谷歌位于伦敦的办公室中,聆听谷歌的特别发布会。宾客们享受着谷歌翻译 Logo 形状的小饼干,手中拿的是印有不同国家语言的纸张(我的是挪威语),此外还被邀请下载 Google Translate 的软件。桌子上的甜甜圈和冰沙都用小牌子标注出各种国家的风味。过了一会,大家被引到了一个黑暗的小剧场中。
Sundar Pichai,Google CEO 伦敦市长 Sadiq Khan 首先上台致辞。他以「我有一位朋友」开场,提起对方对他说,市长大人总让他想起谷歌。市长说,「为啥,因为我什么都懂?」朋友否认道,「不是的,是因为你就像谷歌一样,总是试图把我的话补完。」会场传出了善意的笑声。随后,谷歌 CEO 桑达尔皮查伊上台发表演讲。 皮查伊此行的一项议程是莅临庆祝谷歌伦敦国王大道新大楼的建成。此外,基于他在不少场合都宣告谷歌的未来将以「AI 为先」,这句话引来了不少猜想。在他的演讲中,皮查伊提到了这句话的真实含义:在未来,谷歌的产品不再是传统计算编程的结果,而是「机器学习」。 谷歌大脑——这是谷歌一个鲜少被提及的部门,实际上已经成立了五年时间。这个部门一直遵循着一个原理:人工「神经网络」能够像婴儿一样,通过不断试错来理解世界,而这能让机器拥有像人类一样的灵活性。这条圭臬并不是什么新主张——早在上世纪 40 年代,也就是现代计算机早期阶段就出现了。但少有科学家将这一想法落地,毕竟它看起来太遥远也太神秘了。直到 2011 年,当谷歌大脑计划采用这一方法攻克人工智能,采用机器学习来优化谷歌的移动平台。比如,安卓的语音识别现在已经能媲美人类水平;比如,图像识别也已经在一年前首次运用于消费者产品上。 Google Translate 于 2006 年上线,目前已经成为谷歌最受信赖及流行的应用之一。每天,Google Translate 会面对 5 亿个月度活跃用户的 1400 亿个不同语种的单词。它不仅仅是作为一个独立应用而存在,而且作为 Gmail、Chrome 及许多其它谷歌产品的集成功能,我们将它作为一个按钮——一个毫无障碍、非常自然的电子组成方式。皮查伊在台上提及,直至叙利亚难民危机之时,公司才意识地区间的翻译交流是何等重要。在他背后的屏幕显示,在那段敏感时期,阿拉伯语与德语互译的谷歌翻译请求增长了五倍之多。(这也与皮查伊的想法一致,他在印度出生成长,而雷锋网要指出的一点是,印度是一个多语种国家。)谷歌翻译在此后也已经在稳定增加语种的丰富性,并完善功能,但在过去四年来,质量提升的速度已经大不如前。 直至如今。上个周末,雷锋网也提及了 Google Translate 的大更新,系统已经将大部分请求转换到基于人工智能的系统进行处理。这一更新在美国、欧洲和亚洲都已经上线,包括西班牙语、葡萄牙语、法语、德语、中文、日语、韩语及土耳其语在内的语言,都可以实现与英语的互译。而其它上百种语言也在紧锣密鼓地更新中,以每月预期八个的速度计划在年底前更新完毕。而对于谷歌工程师而言最大的惊喜在于,他们只用了九个月时间就提前完成了。A.I. 系统所取得的进展速度之快,大概就相当于在一夜间掌握了以往技术的总和。 皮查伊对于含蓄的古典文学尤为着迷,一个月前,他曾告诉我,在他山景城的办公室里发表演讲时,PPT 上有些文字还是需要 Google Translate 来辅助显示,毕竟并不是所有人都像物理学家 Robert Oppenheimer 一样能读原版的《博伽梵歌》(雷锋网注:印度圣典,由梵语写就)。因此在伦敦的发布会上,幻灯片上出现了博尔赫斯的经典名言:「Uno no es lo que es por lo que escribe, sino por lo que ha leído.」(评判一个人不应看他所写,而应看他所读。) 带着微笑,皮查伊大声地读着由旧的 Google Translate 展示的令人有些尴尬的直译版本:「One is not what is for what he writes, but for what he has read.」 而在大屏幕的右边,新版的 A.I. 系统版本则展示了一个更加信达雅的译文:「You are not what you write, but what you have read.」 这句话用来描述新版的 Google Translate,却也恰如其分:在某种意义上,Google Translate 的确是第一台通过「饱读诗书」而通晓知识的机器。 谷歌决定围绕 A.I. 而重组公司,实际上是全球机器学习热潮的第一批拥趸。在过去的四年里,谷歌、Facebook、苹果、亚马逊、微软及中国的百度,这六家公司都围绕人工智能展开了一场声势浩大的「人」备竞赛,而大学自然成为了兵家必争之地。企业纷纷向顶尖的学术院系抛出橄榄枝,许以极大的资源和自由。比如硅谷众人皆知 Facebook 惜才如命,CEO 小扎会亲自通过视频和电话来了解公司即将纳入麾下的优秀研究生,七位数的年薪起跳根本不在话下。而参加人工智能的相关学术会议的人士几乎增加了四倍。科技巨头们在关心的,不仅仅是小打小闹的技术进步,而是如何掌控接下来即将来临的计算平台:普适性极强、无处不在的人工智能。 「人工智能」这个词似乎总是出现得这么理所当然,但实际上它一直是引起混乱和争议的源头。想象你正置身上个世纪 70 年代,在路上拦住了随便什么人,掏出了一个智能手机并向她展示里面的 Google 地图。如果你尝试说服她,你不是什么奇怪巫师,而你拿出的「黑色护身符」也只是一个比阿波罗时光机更为强大的微型电脑,谷歌地图实际上毫无疑问,就是一个能向她展示什么是「人工智能」的东西。的确如此,这个应用能够为你制定更棒的路线,比如从酒店到机场——显然,机器能比你做得更快更好,此外,它还能对交通进行评判,规划最佳路线,并当你「误入歧途」时,重新判断你的位置并推荐新的路线。 实际上,今天没有人会把谷歌地图与「高贵的」人工智能相提并论。当我们在使用智能这个词的时候,是带着情感色彩的。我们所理解的人工智能,是能与其它初级简单的事物所能完成的东西不同的。现在,我们能用自动化完成一项任务,那么所涉及的相关技能就会降级为一种单纯的机制。而今天的谷歌地图,似乎还不能对应上我们所想象的「人工智能」这个词,而只能充其量叫作「机器」(robotic):只接受一个明确的请求(从某处到另一处),并尽力满足这个需求。因此,人工智能这个词所能对应的实际工作已经在缩小。 皮查伊将目前的人工智能应用与「通用人工智能」这个终极 boss 区分开来。后者不会涉及具体的指令,而将是一个通用工具,为一般情况下的一般用途而设计。皮查伊认为,公司未来的运转将主要依赖通用人工智能。想象一下,如果你告诉谷歌地图,「我要去机场,但我中途要停下来为我侄子买个礼物,」一个通用版本的人工智能服务——就像三年前的电影《Her》中,斯嘉丽约翰逊所配音的那个无所不在的助手一样。她能够像你的亲密朋友一样,知道你的一些基本情况:侄子的年龄、喜欢给孩子买什么、哪能找到一个购物商店。但一个真正智能的地图也能做一些亲密朋友所考虑不到的事情,比如你侄子的学校里,孩子们最近最时髦玩些什么。一个智能的机器能够通过错综复杂的数据抽丝剥茧,并寻找出那些甚至我们自己都浑然不知的需求。 人工智能的新浪潮,也就是 AI 助手——就像苹果的 Siri、Facebook 的 M 及亚马逊的 Echo,都是机器学习的产物,作用大同小异。这些公司在消费者身上做着机器学习之梦,但是机器学习并不一定只局限在消费者身上。三星的医学影像子公司今年宣布,其新款的超声设备能够检测乳腺癌,而管理层也在努力增加人员贮备,以扩大计算机的行业应用。DeepMind 在 2014 年被谷歌纳入麾下,虽然当时的预测显示,人工智能在十年后才能战胜人类,但 3 月份,AlphaGo 就以 4:1 战胜了围棋大师李世石。 1950 年,艾伦图灵提出的测试指出,计算机如果能在五分钟的文本交流中成功欺骗一个人类对话者,那么就算测试成功。是否机器能在两种语言中自由切换,并能很好地理解人类的语言进行对话?谷歌大脑的成员们正在推动和帮助监督 Translate 项目,满怀信心地相信这样的机器能够成为未来的一位通用人工智能助手。 接下来雷锋网要展示的,就是 Google 的研究人员和工程师们(刚开始只有一两个人,后来变成三四个,最后成长到了上百个)沿着这一方向取得巨大进步的故事了。这是一个非常少见的故事,尤其是因为它与我们惯常对硅谷的印象相悖。这个故事里面,没有那种在车库里捣鼓一些东西,认为自己可以改变世界的人。它不是一个关于科技解决所有问题的故事,也不是一个关于技术会导致世界毁灭的故事。它也与颠覆无关,至少不是我们通常认为的那种颠覆。 事实上,里面有三个重叠的故事,它们在 Google 翻译向 AI 的成功转型中整合在了一起:一个技术故事,一个制度故事和一个关于思想演变的故事。
第一个故事是 Google Translate 的故事,它发生在山景城的九个月时间里,解释了机器翻译的转变。第二个故事是谷歌大脑的故事。第三个故事是深度学习的故事,它发生在苏格兰、瑞士、日本、加拿大等地遥远的实验室,时间跨度七十多年,它甚至改变了我们对那个会思考的自我的认知。 这三个故事都与人工智能有关。七十年的故事与我们对人工智能的期待与渴望有关,二十五年的故事与它在近期可以做什么有关,而那个九个月的故事则与它现在能做什么有关。这三个故事都是对概念的验证,而所有的一切都只是开始。 以上是全文第一部分,敬请期待雷锋网的后续文章。 via NewYork Times (编辑:淮北站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |