吴恩达,百度的首席科学家和技术名片,这位中文讲得一塌糊涂的美籍华人成为百度世界 2014 的一个「彩蛋」。吴恩达不算太长的演讲依然挑战了听众的耳朵。这是他第一次公开用中文演讲,集合了英语、普通话和粤语口音的复杂语言还时不时停顿,据说这还是在其彩排 3 次之后所达到的效果。不过,这并不妨碍他把事情说清楚。
上午吴恩达提出了两个关于人工智能的核心观点。
一是「人工智能需要正循环」,「你有一个好产品,你就可以有大量用户。有了大量用户,你就有大量数据。这些大量数据用于人工智能,你的产品就会更好。人工智能正循环越滚越快。」
二是「人工智能三大要素」,优秀的 AI 人才、海量的有效数据以及扎实的基础架构。正是因为百度具备这三大要素,因此他愿意转投百度。
在演讲最后吴恩达表达了私心:中国科技一直是追赶者,在人工智能这一点上看到了中国公司有希望追上甚至引领全球,他选择百度正是想帮助中国公司在人工智能上取得先机。
吴恩达,4 个月前离开 Google 加入百度组建百度硅谷实验室,负责被寄予厚望的「百度大脑」项目。百度与 Google 有何不同,人工智能究竟是不是纸上谈兵,百度硅谷实验室发展如何?在下午与吴恩达面对面的专访中我找到了答案,全程采访为中英文翻译的形式,笔者凭记忆分享给大家难免疏漏,敬请谅解。
吴恩达透露百度硅谷实验室现已拥有超过 60 名员工,在 4 个月时间里一切进展顺利,「没有想象的那么难」。百度硅谷实验室在招揽硅谷高端 AI 人才时,比想象的容易许多,号召力超出其预期。因为很多工程师毕生都奋斗在人工智能,如果能提供一个好平台让他们研究人工智能就非常有吸引力。不过,「挖角」并不是硅谷实验室的主要任务,其核心是做以人工智能和深度学习为主的前沿技术研究。
这个实验室是「任务导向型」的,团队围绕深度学习和人工智能做出研究成果之后,百度其他部门会很快将成果应用到产品之中,目前深度学习成果已被应用到百度广告系统并大幅提升了广告转化率、百度大数据引擎和百度预测平台也用到了深度学习技术。在百度世界发布的「BaiduEye」可以隔空取物,核心难点和技术便是图像识别——注意,不是简单的人脸图书识别,而是对动态的、复杂的、多变的环境进行精准识别,要实现这一点就必须依赖深度学习。
吴恩达表示,百度与 Google 有许多相似之处,譬如都是搜索引擎为核心、都崇尚和热衷于投资前沿技术,但也有所不同。百度更强调快速将研究成果应用到生产产品之中。当被问及「Google I/O 大会与百度世界大会定位很像,有何区别」时,吴恩达的回答是,两个大会都会发布前沿技术驱动的产品,作为一名坚信人工智能就是未来的人,他都十分喜欢。尽管 Google 有无人驾驶汽车、有 Glass 等全球闻名的「智能设备」,但百度在本次大会上推出的筷搜、BaiduEye 以及 CoolBox(一款可以与人对话和播放音乐的设备)着实让人眼前一亮,尤其是 BaiduEye 更是典型的人工智能应用,它十分依赖图像识别技术。
吴恩达最为人所知的实验项目「机器学习识别猫「正是他在加入 Google X Lab 之后所完成的。百度有没有与 X 实验室对应的研究前沿或者新奇酷产品的机构?未来是否会有?吴恩达的答案是,这并不重要。百度整个公司都让他感受到一种创新氛围,接触的每个员工都渴望创新,百度已提出要成为全球的创新中心。百度研究院承担了前沿技术创新的职责并且取得有目共睹的成绩。言外之意是,百度研究院就是 X 实验室。
深度学习与机器学习究竟有何不同?吴恩达认为,深度学习是机器学习的一种,但它更像是模拟人脑过程来进行学习。一个儿童在一定外部训练之后便可以理解什么是电脑,不需要父母找来所有型号的笔记本一一告诉他,因为人类大脑拥有推理、记忆这样的思维能力。深度学习做到的就是完全模拟人脑,其终极目标是使用无标签数据,通过大规模无监督机器学习来实现,但目前的深度学习还是处于使用标签数据、有监督学习的阶段。笔者理解深度学习是算法的算法,它可以让算法自我进化进而让机器的思考不断成熟最终让机器不断成长。
李彦宏曾对外透露过百度大脑已经拥有 3 岁婴儿的智力。吴恩达说,直接将百度大脑或者一个深度学习神经网络与儿童年龄对比可能并不贴切,机器在大数据运算上比人强,但找任何一个小孩儿识别图片都会比机器强。他无法告诉大家百度大脑现在智力到几岁了,但相信随着时间推移,在「基础架构、海量数据和优秀人才」这三个要素的支持下,百度能够实现人工智能的正循环,不断取得进步,人们未来可以直接与设备对话并让其完成各种任务,都会成为现实。
*作者微博@互联网阿超,微信 SuperSofter