|  首页  |  资讯  |  评测  |  活动  |  学院  |  访谈  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 学院> 速记>

【2017CCF青年精英大会】汤晓鸥谈人工智能明天

2017-05-21 02:26 作者:蔡小飞 来源:硅谷网 HV: 编辑:GuiGu 【搜索试试

【硅谷网报道】北京时间2017年5月20日,以“科研·产业·融合”为主题的2017CCF青年精英大会在北京国家会议中心举行。本次大会由中国计算机学会(CCF)主办,Xtecher协办。大会邀请了30+位学界大咖,首次曝光12项高精科技,并设有人工智能、大数据、云计算、信息安全、综合领域等5大前沿技术头脑风暴会。香港中文大学教授、工程学院副院长汤晓鸥做了主题为《人工智能的明天,中国去哪?》的分享。

以下根据演讲实录整理:

谢谢主持人的介绍。非常感谢组委会的邀请,尤其是跟我讲请了三位学者讲,第一位赵部长主要是讲学术领域方面的,后面的老师是怎么样落地用到实际生产中,我在中间是承上启下的说法,我不知道我理解的对不对。今天讲座,像一个杠铃一样重量主要是在前面和后面,我在中间是很细的杆把这个重量连接起来。虽然份量很轻,但是压力非常大,我想了很久,虽然不太会说话,但是还是来了。

今天我讲的题目:人工智能的明天,中国去哪儿?份量比较轻,我选了一个比较大的题目,压压场上。原来我给题目比这个还大:人工智能的明天地球去哪儿?我后来想一带一路刚刚开完,地球去哪儿已经解决了,我还是回到我的小题目,中国去哪儿。

不管讲什么都是用我儿子的照片开始,以前我用主要是他长得漂亮,没有什么其他的原因,还是有一些原因了,因为他最近对演戏开始感兴趣了。我说当演员是没戏了,我也当想,但是你得长得漂亮。我说如果你继续免费让我用你的照片,也许我可以帮你成为一个网红,他也不知道网红是什么,所以也就同意了,所以我今天还是用一下。我今天讲的跟他的照片没有太大的关系。

不管人工智能怎么样发展,还是年轻人创业和做研究,其实我们要做的事情也就是三件事情:

第一,把基础打好,需要花时间,刚才赵部长讲的很好,就是要坚持,真正花很长时间把这个基础打好,做什么东西都不是说一夜之间就所有人开始做人工智能了。

第二,要做创新,要做新的东西,不要老是跟在别人后面走。

第三,把漂在上面的东西要落地,还要产业化。

今天从我们实验室的研究和公司做的产品,来讲讲对这三个方面的理解。

什么是人工智能?现在已经非常难定义了,几乎所有事情都可以说是人工智能,我的理解来讲人工智能应该也是深度学习,因为以前的人工智能确实是在很多情况下用不起来,就是人手设计的人工智能还是比较难超越人在做某一件事情。由于有了深度学习我们可以把它变成一个数据驱动,这个数据量大到一定程度,参数量到一定程度,在某一件事情上机器可能超过人类,很多现实中落地的东西,其实都是深度学习做出来的。深度学习做触处机来的,成功东西比较多,语音是一方面,可能更多还是做视觉方面,所以大家可以看到很多计算机视觉方面新的成果。在我看来,我所讲的人工智能其实也就是计算机视觉,用深度学习做计算机视觉,就变得更窄了。

大家可以看到深度学习的词在谷歌上搜索,从2006年开始有这个词,这是这些前辈发明了这个算法。2000-2011年是很平稳的,只有在学术界才会去所搜索这个词语,才知道这样的事情。2011年突然之间开始起来了,成指数性的上升,现在搜索量已经非常的巨大了。这条曲线代表了深度学习的爆发过程。

深度学习到底在做什么事情?实际上他所做的事情是非常艰难,从X到Y,或者从A到B,你给我一个输出我怎么样输出?只是说这些事情做得非常好。把这个Make做得非常好,其他算法也可以,只不过做得不如别人好,现在它做到极值。比如说给了一张照片,我就可以给你讲出这个照片的名字,我给你一个物体的形状我就可以告诉你这个物体是什么物体,你给我一个车的场景、相机的场景,我就可以给你输出这个车应该往哪儿拐,你给我一个医疗的图象,我给你判断这是什么病,实际上就是这样的一个过程。不要把人工智能想象成可以超越人类,可以控制人类,这些都是所谓的“好莱坞人工智能”或者想象中的人工智能,真正人工智能在我们这个阶段其实就是这句话。做到这件事情其实是很不简单的。

最近这几年深度学习确实在学术界、工业界取得重大了突破,第一个突破就是语音识别上,这是微软的邓丽老师在2011年语音识别上取得了巨大的成功,昨天可能大家在微信也刷屏了,等丽老师老师从微软出来到顶级对冲基金。我的理解也是A2B,把邓老师深度学习经验,所有东西都输入到对冲基金,这个对冲基金的钱就到了邓老师口袋里面了。语音识别取得了巨大成功以后,2012年人脸识别之前我们一个点一点推,他一年就推了十年的进步,所以在学术界引起了很大的轰动。2014年做人脸识别中深度学习做到的人脸识别超过了人的研究。最后2016年还是谷歌的最厉害,每年120亿美金的研发投入是没有白投,下了一盘棋叫Ip GO啊法狗??,这盘棋下完之后人工智能不需要我们解释了,大家都明白了,人工智能就是下棋。接着自动驾驶也取得了一些重大的突破,现在比较热门的又开始了在医疗图象上进行人工智能的诊断。深度学习其实有三个核心的要素,一个是学习算法的设计,你设计的大脑够不够聪明,第二个要有高性能的计算,要有一个大的集群训练比较大的网络,还必须要有大数据。

我们在深度网络学习方面做的一些工作,2011年开始做这项工作,一开始没有开源的系统,所以要自己做很多的工作。做得时间长了,实验室就做了一套Parrots系统,不是开源的。这项系统我们就说训练一个非常深的网络,原来Imagenet是八层,后来谷歌是22层,后来Resnet是52层,以及2018年是120层。这是设计一千多层的网络,大家可以看到这个深度。很细的线就是网,中间一个格往外走,这个中间叫做Palynet,用这样的一个net,我们在做这个分类上做了目前为止最好的结果。

目前在Imagenet最好的结果,前面是谷歌的结果,中间是Fcoabook,也是大华团队做的。前一段时间在我们系里面大华做了一个讲座,揭示了整个这个结构,我们系里面老师得出一个结论,这个上面我们信息工程系的两个学生之间的战争。

在检测上大家可以看到这个进步速度,2013年一开始的时候物体检测准确率是22%,但是很快谷歌可以做到43.9%,我们做到50.3%,紧接着微软是62%,现在最好结果是66%了。这个速度是几年之内翻了三倍,也是深度学习的力量。

我们训练出来这样一个大脑,可以把它应用到各个方向,做出了很多各个领域不同的技术。在人脸方面我们做了人脸检测,人脸关键点定位,身份证对比、聚类以及人脸属性、后期检测以及等等,第一个深度学习的文章从我们实验室出来的。智能监控方面,做了非机动车结构化研究,人的属性,大概有70种的属性。人群定义了90几种属性。在衣服的搜索以及物体的检测和场景的分类和车型的检测,车型检测定义了几千种车型的分类。在文字的方面,小票的识别,信用卡的识别,车牌的识别,这些都是由深度学习的算法来做的。同时在图象的处理方面,在去雾、超分辨率抖动SDR各种滤镜的研究都是用深度学习的算法,我们基本上用一套大脑做很多的任务

另外一个门槛就是高性能计算,以前高性能计算大家都是讲的CPU,科学计算,很多都是GPU,做GPU的集群目前是一个比较大的门槛。我们在北京做了三个GPU的集群,在香港做了一个大的集群,用这些集群训练我们的我们的网络。

大数据,如果把人工智能比喻一个火箭的话,大数据就是这个火箭的原料。

工业界跟300多家的厂商客户进行合作,所以积累了大量的数据,属几亿的图片,有300多人的团队专门做这个数据标注。包括几千个车的据,以及人群的大数据以及衣服的搜索和分类的数据库,对于学术界以及工业界都是很有益的。谷歌做的体量更大,他们还会做一个非常大的医疗图象的开放,跟NH,回头在医疗方面我相信大家会有大量的数据进行处理。这个时候对于我们的高性能计算又提出了一些新的要求。

实验室比较有幸做的比较早。我们起步很早,在很多的计算机视觉有人脸检测,人群、等等各个方面,这里列了全球第一个深度学习解决这些问题,是由我们提出来的。也相当于说对创新的一些贡献。被评为全亚洲唯一的人工智能研究先趋,非常荣幸跟MAT以及斯坦福这样的名校,以及深度学习的顶级大佬,脸书、谷歌等等的在一起,觉得非常有幸。还要做一些更多现在没有的技术,比如说,这个大家可能以前见过很多,以前都是用深度摄像头来做的,它的信息量很大,这个团队做的实际上用单个摄像头,很便宜的单个摄像头,单个摄像头做这样的效果还是非常不容易,尤其做到实时,在智能驾驶方面等等都有很大的应用前景。

这个工作是去年做的,根据一个人的照相,两个人的摆姿势的感觉,可以判断两个人的情感,是朋友还是敌人的。同时可以根据两个人的表情也可以判断两个人的关系,所以以后如果你把你的照片上载到互联网上,实际上我们完全可以判断出来跟你一起照相的这个人,跟你具体是什么关系。有甚么用,大家都会把照片放到网上,我们用这些捉片判断这些人的感觉,如果你跟一个非常名的人,或者跟一个非常有钱的人照了一张照片,那你这个人可信度可能就增加,这是实时判断两个人的关系,可以看到两个曲线,根据他们实时判断两个人的关系。我们判断这种关系,你的可信度就可以提高了,或者你跟一个罪犯长了一张照片,你的可信度就下降,我们用这个就可以做金融的征信,把不同的关系网建立起来,把信用度传播出去。这个关系可以做得更多,把一张图片所有物体之间,哪个在上面,哪个在后面,互相是什么关系,可以由一张照片判断出来。

这也是最新的工作,这是小刚他们实验室做出来的。我们定义了70种人的特性,根据这个特性进行搜索。现在定义一个新的搜索模式,就是用自然语言来搜索,就是我说一段话来描述这个人,把这个人描述出来以后用这段话去搜索我要找的这样一个人,这个信息量其实是更大的,找的是更准了,实际上可以提供的,比如说用这些话我们再建立一个大的数据库,来源做这件事情。在这个数据中,自然语言,人体有70几种,但是从这些自然语言里面我们可以抽出不同的词,用词来描述不同的人,这个信息量巨大,搜索准确率也大幅度提高。这是具体的结果。用自然语言做人的搜索。大家可以想像一下在医疗上可以用,多模态的医疗诊断上。一个是医疗的图象,一个是医生的诊断,可以实时的识别出来,进行自然语言的分析,把两个进行结合再进行诊断。

这是大华他们所做的工作,根据这个Vido的内容,判断这段时候是Romance的视频,还是一段灾难。你可以看到那两个曲线,现在是Romance的线就上来的,如果是灾难,那个灾难的绿线就上来了,实时根据这个内容判断剧情,这应该也是去年的工作。

今年目前他们又做了一个新的工作,可以根据电影的在实时计算机判断,根据这个视频以及各种各样的内容作用源来理解判断这个里面的剧情,然后同时也可以把一个演员,在整个电影里面,在什么地方出现,在那段时间剧情用自然语言描述出来,把整个电影的内容分析,用自然的方式可以分析出来了。将来插播广告,还可以搜索各种不同的片段。

还有一项工作超分辨率,就是把很模糊的图象放大?这个好莱坞的图象,这个视频抓到一个很模糊的嫌疑犯罪的图象,然后把它实时的变得很清晰。这是这个电影上演的效果,我们还是很震撼的。实际上我们用传统算法做一下,我们以为可以用比较漂亮的样子,实际上用传统算法做出来这样效果。跟人脸检测以及人脸识别方面进行积累,实际上做了10、20篇文章,最后又得到了比较好的结果,我们能不能做到这样的一个结果呢?这是我们希望得到的目标,把应用方向还可以在低清晰度的电视放成高清,这也是一个应用方向。这是我们做的最新的结果。左边直接放大,右边是我们直接放大的结果,已经基本上可以达到高清的效果了。在日本,也把这个卡通的放大,也是有很好的效果。

2016年的时候,推特跟谷歌密集做了几篇文章,就是做超分辨率的。实际上就是用深度学习,实际上这件事情就是怎么样开始?2014年做的超分辨率,2015年有做了一篇,把这个速度加上去了。2016年又做了两篇,取得了比较大的突破。2017年我们紧接着又做了三篇,目前再到实时以及效果实用化的阶段。目前可以看到最好开创性的工作也是做的。实时的监控,公安监控摄像头可以把人看的比较清晰了。

这是实际的产品方向的开发,有自动驾驶,有六个方面的技术,有30多个核心的技术。我在这里面就简单举几个例子做演示。这是车的检测,这是人的实物检测?这是路的检测,这是实时的分割,我们也做到前端,用前端的芯片做实时的效果。对人的标清的互动以及手势的互动。

这是在人脸的布控系统,这已经在很多城市实时布控了。这相当于百米之外抓人,百米之外看到一个目标拉近然后进行人脸识别。这是百米外抓车,可以把这个人进行人脸识别,这是百米外的人群,把人群一个人进行识别。这是视频结构化,把视频里面的车以及特性都检测出来了,标注出来了,这样把整个视频变成了文件和文档,就可以进行文档性的搜索。这是在中国移动的实名认证系统,去年跟中国移动做了三亿人的视频认证,这是小米的宝宝相册,这是华为的智能相册,这是FaceU做的特效,微博这样特效绝大部分都是我们进行人脸识别、人的跟踪的技术做出来的。实际上在人工智能落地方面我们做了蛮多的落地产品,去年的双创活动中几百家企业里面选了两家代表中国人工智能,右边是百度,左边是商汤科技。

在中国创业是一个什么感受?我觉得中国创业就像跑百米一样,要跑的非常快,第一个到达终点才可以活下来,但是这个跑道是满地都是坑的跑道,要不然跑到最快,要不然还没有起步就掉坑里面就死掉了,这个困难肯定是有的。年轻人要不要创业?尽管这个坑还是比较多,但是创业还是可以试一试的,我给一个忠告用什么钱可以创业,什么钱可以用,什么钱不可以用,那首先你父母的钱你不可以用,你自己第一桶金可以用,烧完了之后你们还可以继续用。投资人的钱,投资人的钱肯定是可以用的,因为这都是有钱人的钱,都是这些大佬,都是非常过净值的钱,我觉得劫富济贫人人有责,大家还是出来创业吧。谢谢大家。

【对“【2017CCF青年精英大会】汤晓鸥谈人工智能明天”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
·【硅谷速记】2017CCF青年精英大会部分实录上
·2017CCF青年精英大会:人工智能的明天在哪里?
·【2017CCF青年精英大会】赵沁平:虚拟现实看科技
头条
·【硅谷速记】张小龙:全面阐述小程序来了!
图文
2018国际文创产业合作伙伴大会9月11日上午实录
2018国际文创产业合作伙伴大会9月11日上午
RTC 2018实时互联网大会之声网媒体沟通会实录
RTC 2018实时互联网大会之声网媒体沟通会实
2018国际文创产业合作伙伴大会9月11日上午实录
2018国际文创产业合作伙伴大会9月11日上午
RTC 2018实时互联网大会之声网媒体沟通会实录
RTC 2018实时互联网大会之声网媒体沟通会实
最新
·第二届河北国际工业设计周开幕式主旨演讲实录
·2019年九号机器人AI产品发布会全程文字实录
·2019烯旺科技医疗成果发布暨招商大会全程文字实录
·2019年网络安全生态峰会:支付宝芮雄文专访速记
·2019九号机器人AI产品发布会速记实录-创造AI运力
热点
·【硅谷速记】特朗普就职演讲全文(中英对照版)
·nokelock 2019 全球新品发布会全程文字速记实
·2018国际文创产业合作伙伴大会9月11日上午实
·【硅谷速记】家园网马永才接受硅谷网等群访录
·GrowingIO 2018增长大会主会场上午现场速记实
旧闻
·首届“数字营销在线选型节”新闻发布会全程实
·【硅谷速记】苏宁易购418家电3C狂欢节发布会
·【硅谷速记】2018年中国TMT行业“领秀榜”盛
·【硅谷速记】推想科技人工智能医疗平台发布会
·2018 AGM X3喜马拉雅新品发布会媒体群访速记
广告
硅谷影像
2018国际文创产业合作伙伴大会9月11日上午实录
2018国际文创产业合作伙伴大会9月11日上午实录
RTC 2018实时互联网大会之声网媒体沟通会实录
RTC 2018实时互联网大会之声网媒体沟通会实录
【硅谷速记】GMIC北京2018:知乎李大海演讲实录
【硅谷速记】GMIC北京2018:知乎李大海演讲实录
【硅谷速记】GMIC北京2018上苏宁乔新亮演讲实录
【硅谷速记】GMIC北京2018上苏宁乔新亮演讲实录
【硅谷速记】UC光谱计划开放平台发布会实录
【硅谷速记】UC光谱计划开放平台发布会实录
【2017CCF青年精英大会】汤晓鸥谈人工智能明天
【2017CCF青年精英大会】汤晓鸥谈人工智能明天
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2020 硅谷网. 版权所有. All Rights Reserved. <京ICP备12003855号-2>