在过去三十年时间里,纽约大学教授Yann LeCun一直都致力于探索人工智能,他设计了所谓的“深度学习”计算系统,这种系统能以类似于人脑的方式来处理信息。而在三十年后的今天,他将把自己的工作成果带给社交网络巨头Facebook。
本周早些时候,Facebook宣布其已经聘用了这位法裔科学家,他将担任该公司新建立的人工智能实验室的负责人,这个实验室的相关业务运作将横跨美国加州、伦敦和纽约。Yann LeCun将在位于曼哈顿Astor Place的Facebook新办公室办公,负责管理深度学习工具的开发工作,这种工具将可帮助Facebook对来自其流行社交网络服务的数据和用户行为进行分析,并追踪改变其服务的运作方式。
Facebook将可利用深度学习工具来自动鉴别用户上传的照片中的人脸,自动标记出正确的姓名,并将其与用户的好友和家人即时共享。此外,这种工具还能对用户在Facebook网站上的日常活动进行分析,然后自动显示出用户想要看到的更多内容。
从某种程度上来说,Facebook与人工智能的结合会让人感到有些不寒而栗,原因是深度学习能提供一种更加有效的方法,让Facebook对你最私人的习惯进行分析。
“通过深度学习工具,Facebook所能做到的事情几乎是无限的。”穆罕默德(Abdel-rahman Mohamed)说道,他在多伦多大学也正在从事类似的人工智能研究工作。“在每一天,Facebook都会收集人们互相之间关系网的信息,并获取你在一天中所从事之各种活动的相关信息。Facebook将会知道你投票给了民主党还是共和党,还会知道你购买了什么产品。”
但与此同时,如果Facebook能在其人工智能技术与用户的隐私权需求之间达成平衡,那么这个新兴的研究领域对于这家社交网络服务公司来说就是前景无限的。除了Facebook以外,谷歌(微博)、微软和百度(纳斯达克股票交易代码:BIDU)等其他互联网巨头也正在沿着同一条道路前进。
“一方面这很吓人,”穆罕默德说道,“但在另一方面,这能让我们的生活变得更好。”
本周,LeCun参加了在太浩湖(Lake Tahoe)召开的神经信息处理系统大会(Neural Information Processing Systems Conference),这是人工智能社区的年度大会,Facebook首席执行官马克·扎克伯格(Mark Zuckerberg)就是在此次大会上宣布聘用了LeCun。会议间歇,LeCun接受了《连线》杂志的采访,谈及他正在从事的新项目。以下是访谈内容摘要。
问:我们知道,你在Facebook启动了一个人工智能实验室。不过,我们想知道的是,你和你的人工智能团队成员到底正在从事什么工作呢?
答:我能告诉你的就是,这个新组织的宗旨和目标是什么,那就是在人工智能领域中取得重大的进展。我们想要做好两件事情,一是真正从科学技术的角度取得进展,这一过程中我们将参与到研究社区中去,并发表相关论文;二是将我们开发出来的某些技术变成能被Facebook利用的东西。
但这个目标极具长期性,比Facebook目前正在从事的工作要耗费更长时间。从某种程度上来说,我们想要实现的目标与日常生产将是各自孤立的,从而给人们带来更多的空间来事先做好准备。当你解决了诸如此类的重大问题以后,技术就会自然而然地浮出水面。
问:那到底会是什么样的技术呢?能做些什么事情?
答:基本上来说,我们正在开发的技术就是任何能让机器变得更具智能的东西。更具体的说,那就是基于机器学习的东西。就目前而言,唯一能制造智能机器的方式就是让其处理海量数据,然后建立起数据模型。
过去几年时间里,一个名为“深度学习”的系统已经浮现出来,这个系统在运用于图像识别和语言识别等领域时相当成功,在自然语言处理领域中也取得了一定的成功,只是没前两个领域那样大。现在这些方面的应用都已非常成功,即使我们只把精力集中用在这些领域,就已经可以给Facebook带来重大的影响。人们每天都会向Facebook上传数以亿计的图片、短视频和聊天信息。
但我们想要完成的任务不止于此。举例来说,我们要怎样才能真正了解自然语言?如何才能建立起用户模型,从而让系统向其显示的内容中包含他们很可能感兴趣的东西,或是很可能有助于他们实现目标的东西,又或是很可能帮助他们节省时间的东西?这才是Facebook关注的核心内容,而目前已经达到的水平是,我们能决定向人们显示什么信息以及显示哪些广告。
扎克伯格将这叫做“心智理论”,这个概念并不算新,在人工智能和认知科学领域中已经流传了一段时间。我们怎样才能用机器来构建模型,从而知道人类用户对什么感兴趣和将会做些什么?
问:就是说这项工作的核心技术已经很老了,对吧?你还有目前在谷歌供职的吉奥夫·辛顿(Geoff Hinton)在上个世纪八十年代中期就已首次开发出这样的深度学习方法,也就是我们所说的“反向传播算法”(back-propogation algorithm)。
答:那是根基所在,但现在我们已经超越了当时的范畴。反向传播算法能让我们“监管运行”(supervised running),也就是你手头有照片和标签,然后可以训练系统用标签去标记新的照片,这就是谷歌和百度目前用来标记照片的方法。
我们知道这种算法是如何运作的,但对于视频和自然语言,我们手头现有的标签数据是非常稀少的。现在我们还没办法播放一个视频,然后让一台机器告诉我们视频里有什么。不光是标签数据不够的问题,而且到现在我们还不清楚标记视频的水平是否能达到跟标记照片一样高的程度。
因此,我们目前正在从事的工作是利用视频结构来帮助系统建立一种模式来理解一些事实,比如说某些物体互相位于彼此的前方,而当摄像机移动时,位于前方的物体与位于后方的物体的移动方向是不同的。这就要求我们必须发明新的算法,也就是“无监管”的学习算法。
在深度学习社区中,这一直都是非常活跃的研究领域。社区中没人会认为我们能拥有某种“灵丹妙药”,但我们已经拥有了某种程度上类似于此的东西;在某些情况下,这些东西能极大提高纯粹的受监管系统的表现。
问:你刚才提到了谷歌和百度,而微软和IBM等其他一些互联网公司也正在从事深度学习工作。在我们这些门外汉看来,所有这些工作都来自于一个相对较小的深度学习学术团体,包括你和辛顿在内。
答:正是如此。不过我必须要说的是,这个团体正在迅速扩张。你必须认识到,深度学习真的是辛顿、Yoshua Bengio和我自己共同“阴谋”策划的结果,当时我们都在蒙特利尔大学。十年以前,我们聚在了一起,觉得应该开始着手解决机器深度学习的问题。
最开始的时候,人工智能技术是为了控制机器人而开发的。当时我们从加拿大高级研究所(Canadian Institute for Advanced Research)那里拿到了一些资金,辛顿担任项目负责人,我担任顾问委员会主席,然后我们会一年碰两次头,互相交流下项目进展事宜。
之所以说带那么点“阴谋”的意味,是因为机器学习和计算机社区中的大多数人都对这个项目不感兴趣。所以,在很多年时间里,这个项目一直都局限在我们的那些工作室中。但后来我们开始发表论文,越来越多人都开始感兴趣,再后来整个行业也开始感兴趣。与学术界的兴趣相比,来自企业界的兴趣要强大和迅速得多,这真是让人感到非常吃惊。
问:深度学习和普通的机器学习之间到底有什么区别呢?许多人都很熟悉谷歌在创立以后头十年时间里所从事的那种机器学习工作,机器会对海量数据进行分析,然后自动识别网络垃圾什么的。
答:那是相对简单的机器学习。人们付出了很大努力来创造那种机器学习系统,他们觉得系统本身无法真正处理原始数据,必须将数据转换成系统能够消化理解的格式。
举例来说,如果想要系统理解一张图片,那么你不能直接把原始的像素输入到传统的系统中去就行了,而是必须把数据转换为一种能让分类器消化理解的格式,这就是许多计算机社区在过去二十或三十年时间里一直都在尝试去做的事情。与此相比,深度学习能让机器同时也学习上述转换的格式,而不是必须由人来控制系统去解决每一个新问题。【原标题:Facebook深度学习专家:未来的人工智能是怎样】
|