|  首页  |  资讯  |  评测  |  活动  |  学院  |  访谈  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 学院> 速记>

【硅谷速记】2017CCF青年精英大会部分实录上

2017-05-22 16:20 作者:苏索欣 来源:硅谷网 HV: 编辑:GuiGu 【搜索试试

主题:2017CCF青年精英大会

地点:国家会议中心大宴会厅C

时间:2017年5月20日

主持人:各位大家好,我是今天活动的主持人,本次大会副主席,CCF会员,科技创新产业服务平台Xtecher的联合创始人,欢迎大家来到精英大会,本次大会由中国计算机学会,CCF主办,Xtecher协办,随着人工智能云计算、大数据信息安全等计算机技术领域的迅速崛起,新一代信息技术变革已经到来,历史的车轮正驶向第四次工业革命的大门,一直以来学术界产业界投资界都在各自的领域不断摸索,但这产业升级大时代的到来,近几年来一个鲜明的确实发生了,随着用户大数据与机器大数据的爆发式增长,随着计算能力持续增加,越来越多科研工作者主动拥抱产业,他们要么与企业密切合作,要么已经投身科技创业大潮,与资本以及市场共舞。跨领域的交流碰撞也是大势所趋,为了进一步打破边界壁垒,促进产学界进一步碰撞活化,我们打造了彩瓷大会。CCF青年精英大会,今天,是第七届CCF七年精英大会,碰巧今天也是520,不妨把今天的大会看成产学研投的相亲会,很多演讲嘉宾是学界大咖,他们带着积累而来,相信今天会议是不装腔、不作势不讲空话套话的充分交流跨界大派对。

希望今天大家都能够满载而归。简单介绍一下本次活动的主办方,中国计算机学会,简称CCF,中国计算机学会是国家级学术团体,致力于推动计算机专业发展并促进其广泛应用,让专业人士结成学术共同体,构件乘员间的网络,分享研究思想,提升成员专业能力,目前是中国最为活跃的学术共同体之一,而本次大会协办方面我所在科技创新产业服务平台Xtecher,Xtecher包含19大媒体矩阵,致力于围绕科技创新产业做最专业的报道,我们建立了一个覆盖全球超过50个国家的科技人才网络,不断挖掘并服务世界科技人才和企业,如今Xtecher是华人科技创新领域最有影响力的媒体与服务平台之一,今天非常有幸和CCF达成此次愉快的合作。好了,接下来让我们有请中国计算机学会秘书长杜子德为我们进行主办方致辞。

杜子德1996年起任CCF专职秘书长,2005年当选国际信息学奥林匹克主席,让我们掌声有请杜子德先生。

杜子德:对我的介绍从来没有长过,诸位今天是CCF青年精英大会,我们为什么搞一个青年精英大会不搞一个中年精英大会或者老年精英大会,因为青年人需要特殊关注,青年人火油活力和创造力,但是资力尚浅,年纪尚轻,还不被人所认识。知名度各个方面的资源还不够,所以所以我们要特别关照青年人,早在1998年CCF就创建了青年计算机科技论坛到今年已经有19年的时间,在这个基础上我们在几年以前创办了青年精英大会,就是要给青年提供更多的机会,精英,什么叫精英?我们有一个准确的定义,在我看来精英起码应该是衣食无忧,如果我们在马路上还在拉大车,估计成不了精英。精英应该有知识、有智慧,应该有所建树,有文化的人。精英想改变社会,推动社会的进步。我想孔乙己算不算精英,有点文化,但是他没有能力,推动不了,阿Q也不可能推动。但是有些人,像我们山西的煤老板大家是拿取笑话来说,也没有想推动。是精英,有的是2B精英,我们联手使得我们的国家以及社会变得更好。今天的会议,我们要把技术、投资方和产业界联到一块,没有技术产品就没有竞争力,如果没有企业把这个技术变成应用和产品,技术也没什么用。如果没有投资方,我们也很难把这个事情做好,把这三方能够联起来我相信今天的会议会开得非常有意思。谢谢大家。

主持人:非常感谢杜子德。下面有请赵沁平老师为我们分享。

赵沁平:各位年轻的朋友,非常高兴今天能够有机会和计算机界的青年精英,青年朋友们在一起研讨问题,共享体会。来之前子德秘书长说要开这样一个大会,希望让我来做一个发言,我说什么主题?他说如何做有价值的科技。我说能不能做,这个难度比较大。我说做多长时间?半个小时。在半个小时做有价值的科技,我是不行。只能谈一些体会,有人可以。谁可以?一定是作出了公认的,有价值科技的人,还有哲学思想,也善于归纳,几句话把如何做有价值的学问归纳出来的人,这样人是有的,是谁,爱因斯坦。我们看看爱因斯坦的大人物怎么说的。

首先是好奇心,我们思想的发展某种意义上来自于好奇心。我没有特别的才能,只有强烈的好奇心,永远保持好奇心的人是永远进步的人。我从事科学研究是出于一种不可遏制的,想要探索大自然奥妙的欲望,别无其他动机。

还有想象力,想象力比知识更重要,想象力是科学研究的实在因素。逻辑会把你从A带到B,想象力能带你去任何地方。学习知识要善于思考,思考,再思考,我就是靠这个学习方法成为科学家的。

我没有什么特别的才能,不过是喜欢寻根究底地追究问题罢了。不是我聪明,只是我和问题周旋得比较久。坚持不懈才是天才。

人们把我的成功归因于我的天,其实我的天才只是刻苦罢了。人的差异在于业余时间,业余时间能成就一个人,也能毁灭一个人。(比尔盖茨也说过这样的话)对真理和知识的追求并为之奋斗,是人的最高品质之一。

刚才我们的大科学家已经把他做学问,包括他自己的感悟,说的非常清楚,我认为他说的非常好。从他讲的这些来看,我有一些个人的感想和体会。

人类的创新的动力到底有哪些?从爱因斯坦这些大人物他们的总结来看,人类创新动力源自于他的两大本能,一个就是好奇心,这是爱因斯坦讲的。还有就是想象力。人的知心,包括个人的隐私什么秘密他都想知道,这就是人的本能,这是好奇心,保证自然的秘密,自然的奥妙。像我们科学家探索追求自己的奥秘,自然界的秘密。生存的欲望,人动物都有生存的欲望,怎么样环境更好,更适合你的含量,这源由人非常巨大的想象力。动物也有智力,可是想象力只有人才有。好奇心驱动了科学探索,发现自然规律,而想象力包括生存欲望,就是改造生存环境的想象力,能够驱动技术发明,改造自然环境。

无论是好奇心的对象也好以及改善生存环境的对象也好,都有对象,对什么好奇?你的好奇来源于什么,你改善生存环境的对象来源于什么?大体上有这么三类:1,已有的知识好奇。2,好奇的对象是自然界。3,人类社会对象,还有改造环境的对象。首先是已有的技术和设备,另外自然界的对象以及人类社会的对象。

不同的来源是他感兴趣的对象,或者好奇的对象,或者是你想改变它的对象,它的不同来源取决了创新的兴趣。如果你的问题来源是已有的理论和知识,或者已有的技术和设施、设备,这是问题的来源。我们现在绝大多数从事的科学研究,包括我们所指导的博士生、研究生,绝大多数的问题来源都是在这个里面。这也是一个非常好的问题来源,它可以改进完善已有的理论和已有的技术,达到创新的成果,使科技、社会不断进步。还有问题的来源,是直接来源于自然界以及人类社会的对象,一般的原始创新类都是来自于这一类。

作为一个从事科学研究的人,我是从事虚拟现实。90年代初期,1993年以前从事人工智能研究,后来1993年到美国学习,当时人工智能还处于低潮,当时到美国想干什么,想寻找人工智能的背景,因为当时人工智能几乎没有太多的应用,当然在一些领域比如说机器各个方面有一些,但是没有像现在人工智能一样应用这么广泛。到美国以后看到它的虚拟环境,当然它是虚拟战场环境,有一些坦克的行驶路线,有路径规划以及避障,就做这个人工智能,还是图象建模等等。1993年回来以后一直从事虚拟现实的研究,到了2010年左右思索虚拟现实当中的问题,归纳总结十个问题上,这十个问题发表深ACM上,大家看一下这十个问题的题目:

1,是否现实世界所有的事物都是可数字化建模的?因为这个虚拟现实首先是建模,是不是所有事物都可以建模?

2,事物及其建模的复杂性是否可以度量,如何度量?就是模型的复杂性,像我们几何模型,它的目前复杂性通过几何的面片片,我这个是几千万个,我这是几百万个,其他的模型,比如说物理模型等等,是不是还有度量的测度,这是从当时的认识提出这样的问题,就是让我的学生回答,让博士生们回答这个问题。

3,模型的可行性。

4,是否存在着模型相似性度量方法。等等一共提了十个问题,这个问题的来源是已有的理论和结论。

又做了七、八年,我哪儿也有一些成果已经到了可以产业化的地步,所以许多的问题又新了问题,我今年又归纳总结了十个问题,这是发表在今年的计算机科学中文刊上,第一个是VR头戴的显示输入与交互,在座可能都戴过VR头盔,VR头盔是全封闭,怎么输入?因为它是全封闭,实物是看不到,而这个VR头盔里面也看不到人的肢体,所以它的输入是一个问题,更么更友好以及便捷的输入?还有如何在VR头盔里面体现人的肢体,这是需要研究的。大家看这十个问题,基本上都是来源于现有的设备、现有问题、现有装置。对已有问题理论的来源,比较多地转到现有技术和设备产生它的问题来源,更接近于实际,更接近于实用的来源。

目前主要研究的是人体虚拟孪生。目前的建模以后就是固定的,比如说一棵树、一个房子建模模型建好就是这样,虚拟孪生是可以进化,随着你的生长,也可以进行成长,就是在数字化的时候,就是孪生。对真实人体进行多静态多云数据采集,并通过几何物理生理和智能的建模,构建成的一个数字化人体。首先从人体的时间尺度和空间尺度都是跨度非常大的,空间尺度可以从微米到到米,时间尺度从毫妙秒到年以及百年的尺度,更不用说还有人的智能,对人智能的建模。当然它的建模也有很多科学问题,由于时间关系不展开讲这个科学问题了。刚才所说的解剖学的建模,还可以从中医角度讲虚拟人体。人体多尺度单元生理生化模型和人脑及其智能模型,或者人的中医信息学,可以说虚拟人体是虚拟现实的终级目标。如果把虚拟人体建立起来了,那么虚拟现实什么都可以建了。

我们的目标:孩子出生以后,有一个完全等同的数字化虚拟孪生伴随其同步成长,作为其终生的建肯档案和医疗试验体。你做手术,先在这个上面做一做,然后再给人体来做。

前后十个问题,前者大多数是已有的理论和知识,后十个问题,大多数是已有的技术和设施,这是个人本身从事研究问题来源的过程

还有就是人体虚拟孪生,直接对自然现象,直接对人体,这个有可能产生原创性的成果,我和国外的专家进行讨论了,他们基本上在同一个级,而且我们还多一个中医方面,非常有可能作出原创性的成果。

有了问题来源以后,如何切入思考,谈一些个人的体会。如果问题来源是已有结论,我给我的学生讲如果你的来源是看文章也好,看文献也好,首先是抱着怀疑的态度,就认为他有问题,抱着这个态度来看文章和文献的。怀疑他的正确性,或者对它的作用不满意,认为他有局限,抱着怀疑的态度看已有的结论。对已有的理论或者是结论怀疑,寻找它们和客观实际不符或者矛盾之处,指出存在的问题,推翻结论,这本身也应该算是一种创新。就是寻找反例,只要你找到反例,它这个结论就不行了。

简单举一个例子,马希文教授在座大家都知道,在北大的教授,当年做的工作非常好,在美国不幸英年早逝。马老师他想突破图灵计算,是从理论上突破,而且他还研究了一套,就是图灵系统上又增加了一套个功率。是一个可计算序列,如果存在极限的话,这个极限也是一个可计算函数。一个可计算函数的序列如果存在计件,这个计件也是可计算的函数。但是我看了以后觉得图灵计算不容易突破的,这个突破我总是不敢相信的。我觉得再自然,也是有问题的。我就取了一个不可计算的函数,把不可计算的函数定义都是无限的,把这个定义有限化,限定,成为一个函数,这个函数就是看计算,你定义是有限的,它一定是可计算的。不断把这个定义扩大,就形成了一个可计算函数的序列,但是它的极限是不可计算。曾经到美国拜访马老师,马老师说确实这个是有点问题的。首先怀疑他,如果对他已有的结论不满意。比如说你觉得他的效率比较低,或者是他的适用范围比较窄,有一种办法就是把他的算法适用范围给他缩小,一般缩小的算法适用算法,一般来说效率可以提高。相反,还有归纳方法,泛化的方法认为这个作用适用面太窄,扩大它的适用范围,扩大以后又需要许多证明,这一点办法比上一种难度大一些。还有一种结合的方法,这是我们学生常常用的一种办法,针对同一个问题两种不同的解决方法相结合得到一个新的解决办法。上面创新力度并不是很大,但是也应该算是创新的一种。

如果问题的来源直接来源于自然界或者人类事物,或者人类活动,这个难度比较大,要获取数据进行研究创新,我们搞计算机的、模拟仿真等等的范围。

作为我们从事计算机研究的,我们的问题来源有可能是计算机和计算机系统,我们就是要提高计算和计算系统的性能,作为从事计算研究的,我们创新目标大致有三个方面,一个是计算系统更高效,更聪明,还是更适人,这是我们从事计算机系统研究永恒的三个目标。当你面对自然,面对人类社会进行研究创新的时候也有一些大体的思维的方式和方法。首先形成概念,形成新的概念,如果要是形成新的概念这是创新的起点,形成新的概念并进行划分和分类,这也是一个创新的方面,如果形成非常好的概念,进行非常好的划分,这是很不容易的事情,做研究的领域。对于我们从事计算机研究,对你所研究的对象进行分类,这个分类关键在层面,比如说计算和计算相关的类型,比如说数据类型、信息流向进行分类才是在本质上进行分类。

举个例子,比如说对计算机体系结构的分类,指令流、数据流的数据,这就是从指令流以及数据流的流向进行划分的。还有一种对体系结果的划分,是以指令的驱动方式,比如说控制驱动,数据驱动进行指令上的分类。 形成概念,对你所研究的对象形成了新的概念,进行了它的划分和分类,这是创新研究的起点。比如说类比法,就是联想。参考与当前研究对象具有相似性的已有对象的有关另论,将其方法平移过去,这也是有很多的这些方面的类比,获得灵感或者是动物的一些先例,都有这样的例子。 还可以尝试对称和反向思维,就是反着来,你这样考虑我就是反着考虑。自然界很多事物都是对称的,是矛盾的,这是普遍的。比如说你说是数据驱动,我对指令驱动,对计算机的驱动是反着的,这样的事例都有很多。

发现结构和寻找算法,顺序你的论意没有结构就没有高效算法,如何发现这个数据的结构是非常重要的。

寻找特殊点,咱们都讲大数据,找到大数据的共性、特征和相关性,也有许多小数据,特别是特殊点是非常重要的,特别是对于我们科学研究,面向自然对象来说,比如说极值点、临界点、奇点和不动点等等,这些点往往有着和其他点不同的特征和属性。发现这些点的话,很有可能导致创新。

人脸识别,应该有人脸肌肉的拉动,来作出各种表情,人脸的肌肉点是动点,我们的穴位点,人脸上的穴位点是不动,能否把人体和穴位点联系起来是值得考虑的,这些上面都有它的特殊性。如果从这些方面可能能够发现一些意想不到的结果。

发现基本元素,构成你所研究对象的基本元素,这是原始创新的途径。比如说三原色加上灰度变化可以够吃所有的色彩,点线面加上拓扑变换可以构成所有的几何图形。现在有人找人的基本味觉,如果找到基本味觉的话,这个虚拟现实里面的味嗅觉的交互可以实现。现在找到了七个基本味道,七个基本味道可以组合产生所有的味道。

模型化,这也是我们搞计算机进行创作的方法。

模拟人的思维方法,我们计算机就是代替人脑,人工智能就是干这个事情,怎么模拟人的思维。比如说人的归纳推理,人的类比推理能力,现在机器学习就是研究这些方面的。

工具化与芯片化,怎么样把这些算法成为软件工具,再做成芯片,这也是我们技术方面的创新。

可以尝试有计算理论来解释所遇到的所有问题,然建有说软件定义一切吗,用计算解释所有的事情。

刚才谈了由十个科学问题所想到问题的来源,现在主要确定虚拟人体的目标,从事研究问题来源也好,从事的对象也好,目标也好,和我们20年、30年相比还是有了很大的发展。所以在继续跟踪国际先进的科技的同时,完全有可能越来越多的有中国自己的原始创新成果。

当然了,这个科技创新还是没有捷径的,需要多阅读、多体察、多交流、多思索。坚持坚持再坚持,某一天吨吨就会产生灵感,做博士论文也是这样,看了大量的东西,思考了大量东西某一天发现有感觉了,而且这个时间可能需要比较长的时间,有可能需要几年的时间。

坚持非常重要,我带最后还想说,动物也是这样。从进化的角度上,比如说熊猫,应该是吃什么东西,它吃的东西越多越好,这个熊猫不是的,偏偏只吃一种竹子,还有蚕也只吃桑叶,这个进化角度不适合,偏偏就是这个,就是坚持,我就吃这个。坚持到最后,成了国王。

在座青年精英们一定要坚持,在你的理想以及目标上不断坚持,最终会成为我们国家的动量之才、有用的人才,谢谢各位。

主持人:非常感谢赵沁平院士的精彩分享。下面有请汤晓鸥老师及他分享的主题是人工智能的明天中国去哪儿,让我们掌声有请汤老师。

汤晓鸥:谢谢主持人的介绍。非常感谢组委会的邀请,尤其是跟我讲请了三位学者讲,第一位赵部长主要是讲学术领域方面的,后面的老师是怎么样落地用到实际生产中,我在中间是承上启下的说法,我不知道我理解的对不对。今天讲座,像一个杠铃一样重量主要是在前面和后面,我在中间是很细的杆把这个重量连接起来。虽然份量很轻,但是压力非常大,我想了很久,虽然不太会说话,但是还是来了。

今天我讲的题目:人工智能的明天,中国去哪儿?份量比较轻,我选了一个比较大的题目,压压场上。原来我给题目比这个还大:人工智能的明天地球去哪儿?我后来想一带一路刚刚开完,地球去哪儿已经解决了,我还是回到我的小题目,中国去哪儿。

不管讲什么都是用我儿子的照片开始,以前我用主要是他长得漂亮,没有什么其他的原因,还是有一些原因了,因为他最近对演戏开始感兴趣了。我说当演员是没戏了,我也当想,但是你得长得漂亮。我说如果你继续免费让我用你的照片,也许我可以帮你成为一个网红,他也不知道网红是什么,所以也就同意了,所以我今天还是用一下。我今天讲的跟他的照片没有太大的关系。

不管人工智能怎么样发展,还是年轻人创业和做研究,其实我们要做的事情也就是三件事情:

第一,把基础打好,需要花时间,刚才赵部长讲的很好,就是要坚持,真正花很长时间把这个基础打好,做什么东西都不是说一夜之间就所有人开始做人工智能了。

第二,要做创新,要做新的东西,不要老是跟在别人后面走。

第三,把漂在上面的东西要落地,还要产业化。

今天从我们实验室的研究和公司做的产品,来讲讲对这三个方面的理解。

什么是人工智能?现在已经非常难定义了,几乎所有事情都可以说是人工智能,我的理解来讲人工智能应该也是深度学习,因为以前的人工智能确实是在很多情况下用不起来,就是人手设计的人工智能还是比较难超越人在做某一件事情。由于有了深度学习我们可以把它变成一个数据驱动,这个数据量大到一定程度,参数量到一定程度,在某一件事情上机器可能超过人类,很多现实中落地的东西,其实都是深度学习做出来的。深度学习做触处机来的,成功东西比较多,语音是一方面,可能更多还是做视觉方面,所以大家可以看到很多计算机视觉方面新的成果。在我看来,我所讲的人工智能其实也就是计算机视觉,用深度学习做计算机视觉,就变得更窄了。

大家可以看到深度学习的词在谷歌上搜索,从2006年开始有这个词,这是这些前辈发明了这个算法。2000-2011年是很平稳的,只有在学术界才会去所搜索这个词语,才知道这样的事情。2011年突然之间开始起来了,成指数性的上升,现在搜索量已经非常的巨大了。这条曲线代表了深度学习的爆发过程。

深度学习到底在做什么事情?实际上他所做的事情是非常艰难,从X到Y,或者从A到B,你给我一个输出我怎么样输出?只是说这些事情做得非常好。把这个Make做得非常好,其他算法也可以,只不过做得不如别人好,现在它做到极值。比如说给了一张照片,我就可以给你讲出这个照片的名字,我给你一个物体的形状我就可以告诉你这个物体是什么物体,你给我一个车的场景、相机的场景,我就可以给你输出这个车应该往哪儿拐,你给我一个医疗的图象,我给你判断这是什么病,实际上就是这样的一个过程。不要把人工智能想象成可以超越人类,可以控制人类,这些都是所谓的“好莱坞人工智能”或者想象中的人工智能,真正人工智能在我们这个阶段其实就是这句话。做到这件事情其实是很不简单的。

最近这几年深度学习确实在学术界、工业界取得重大了突破,第一个突破就是语音识别上,这是微软的邓丽老师在2011年语音识别上取得了巨大的成功,昨天可能大家在微信也刷屏了,等丽老师老师从微软出来到顶级对冲基金。我的理解也是A2B,把邓老师深度学习经验,所有东西都输入到对冲基金,这个对冲基金的钱就到了邓老师口袋里面了。语音识别取得了巨大成功以后,2012年人脸识别之前我们一个点一点推,他一年就推了十年的进步,所以在学术界引起了很大的轰动。2014年做人脸识别中深度学习做到的人脸识别超过了人的研究。最后2016年还是谷歌的最厉害,每年120亿美金的研发投入是没有白投,下了一盘棋叫Ip GO啊法狗??,这盘棋下完之后人工智能不需要我们解释了,大家都明白了,人工智能就是下棋。接着自动驾驶也取得了一些重大的突破,现在比较热门的又开始了在医疗图象上进行人工智能的诊断。深度学习其实有三个核心的要素,一个是学习算法的设计,你设计的大脑够不够聪明,第二个要有高性能的计算,要有一个大的集群训练比较大的网络,还必须要有大数据。

我们在深度网络学习方面做的一些工作,2011年开始做这项工作,一开始没有开源的系统,所以要自己做很多的工作。做得时间长了,实验室就做了一套Parrots系统,不是开源的。这项系统我们就说训练一个非常深的网络,原来Imagenet是八层,后来谷歌是22层,后来Resnet是52层,以及2018年是120层。这是设计一千多层的网络,大家可以看到这个深度。很细的线就是网,中间一个格往外走,这个中间叫做Palynet,用这样的一个net,我们在做这个分类上做了目前为止最好的结果。

目前在Imagenet最好的结果,前面是谷歌的结果,中间是Fcoabook,也是大华团队做的。前一段时间在我们系里面大华做了一个讲座,揭示了整个这个结构,我们系里面老师得出一个结论,这个上面我们信息工程系的两个学生之间的战争。

在检测上大家可以看到这个进步速度,2013年一开始的时候物体检测准确率是22%,但是很快谷歌可以做到43.9%,我们做到50.3%,紧接着微软是62%,现在最好结果是66%了。这个速度是几年之内翻了三倍,也是深度学习的力量。

我们训练出来这样一个大脑,可以把它应用到各个方向,做出了很多各个领域不同的技术。在人脸方面我们做了人脸检测,人脸关键点定位,身份证对比、聚类以及人脸属性、后期检测以及等等,第一个深度学习的文章从我们实验室出来的。智能监控方面,做了非机动车结构化研究,人的属性,大概有70种的属性。人群定义了90几种属性。在衣服的搜索以及物体的检测和场景的分类和车型的检测,车型检测定义了几千种车型的分类。在文字的方面,小票的识别,信用卡的识别,车牌的识别,这些都是由深度学习的算法来做的。同时在图象的处理方面,在去雾、超分辨率抖动SDR各种滤镜的研究都是用深度学习的算法,我们基本上用一套大脑做很多的任务

另外一个门槛就是高性能计算,以前高性能计算大家都是讲的CPU,科学计算,很多都是GPU,做GPU的集群目前是一个比较大的门槛。我们在北京做了三个GPU的集群,在香港做了一个大的集群,用这些集群训练我们的我们的网络。

大数据,如果把人工智能比喻一个火箭的话,大数据就是这个火箭的原料。

工业界跟300多家的厂商客户进行合作,所以积累了大量的数据,属几亿的图片,有300多人的团队专门做这个数据标注。包括几千个车的据,以及人群的大数据以及衣服的搜索和分类的数据库,对于学术界以及工业界都是很有益的。谷歌做的体量更大,他们还会做一个非常大的医疗图象的开放,跟NH,回头在医疗方面我相信大家会有大量的数据进行处理。这个时候对于我们的高性能计算又提出了一些新的要求。

实验室比较有幸做的比较早。我们起步很早,在很多的计算机视觉有人脸检测,人群、等等各个方面,这里列了全球第一个深度学习解决这些问题,是由我们提出来的。也相当于说对创新的一些贡献。被评为全亚洲唯一的人工智能研究先趋,非常荣幸跟MAT以及斯坦福这样的名校,以及深度学习的顶级大佬,脸书、谷歌等等的在一起,觉得非常有幸。还要做一些更多现在没有的技术,比如说,这个大家可能以前见过很多,以前都是用深度摄像头来做的,它的信息量很大,这个团队做的实际上用单个摄像头,很便宜的单个摄像头,单个摄像头做这样的效果还是非常不容易,尤其做到实时,在智能驾驶方面等等都有很大的应用前景。

这个工作是去年做的,根据一个人的照相,两个人的摆姿势的感觉,可以判断两个人的情感,是朋友还是敌人的。同时可以根据两个人的表情也可以判断两个人的关系,所以以后如果你把你的照片上载到互联网上,实际上我们完全可以判断出来跟你一起照相的这个人,跟你具体是什么关系。有甚么用,大家都会把照片放到网上,我们用这些捉片判断这些人的感觉,如果你跟一个非常名的人,或者跟一个非常有钱的人照了一张照片,那你这个人可信度可能就增加,这是实时判断两个人的关系,可以看到两个曲线,根据他们实时判断两个人的关系。我们判断这种关系,你的可信度就可以提高了,或者你跟一个罪犯长了一张照片,你的可信度就下降,我们用这个就可以做金融的征信,把不同的关系网建立起来,把信用度传播出去。这个关系可以做得更多,把一张图片所有物体之间,哪个在上面,哪个在后面,互相是什么关系,可以由一张照片判断出来。

这也是最新的工作,这是小刚他们实验室做出来的。我们定义了70种人的特性,根据这个特性进行搜索。现在定义一个新的搜索模式,就是用自然语言来搜索,就是我说一段话来描述这个人,把这个人描述出来以后用这段话去搜索我要找的这样一个人,这个信息量其实是更大的,找的是更准了,实际上可以提供的,比如说用这些话我们再建立一个大的数据库,来源做这件事情。在这个数据中,自然语言,人体有70几种,但是从这些自然语言里面我们可以抽出不同的词,用词来描述不同的人,这个信息量巨大,搜索准确率也大幅度提高。这是具体的结果。用自然语言做人的搜索。大家可以想像一下在医疗上可以用,多模态的医疗诊断上。一个是医疗的图象,一个是医生的诊断,可以实时的识别出来,进行自然语言的分析,把两个进行结合再进行诊断。

这是大华他们所做的工作,根据这个Vido的内容,判断这段时候是Romance的视频,还是一段灾难。你可以看到那两个曲线,现在是Romance的线就上来的,如果是灾难,那个灾难的绿线就上来了,实时根据这个内容判断剧情,这应该也是去年的工作。

今年目前他们又做了一个新的工作,可以根据电影的在实时计算机判断,根据这个视频以及各种各样的内容作用源来理解判断这个里面的剧情,然后同时也可以把一个演员,在整个电影里面,在什么地方出现,在那段时间剧情用自然语言描述出来,把整个电影的内容分析,用自然的方式可以分析出来了。将来插播广告,还可以搜索各种不同的片段。

还有一项工作超分辨率,就是把很模糊的图象放大?这个好莱坞的图象,这个视频抓到一个很模糊的嫌疑犯罪的图象,然后把它实时的变得很清晰。这是这个电影上演的效果,我们还是很震撼的。实际上我们用传统算法做一下,我们以为可以用比较漂亮的样子,实际上用传统算法做出来这样效果。跟人脸检测以及人脸识别方面进行积累,实际上做了10、20篇文章,最后又得到了比较好的结果,我们能不能做到这样的一个结果呢?这是我们希望得到的目标,把应用方向还可以在低清晰度的电视放成高清,这也是一个应用方向。这是我们做的最新的结果。左边直接放大,右边是我们直接放大的结果,已经基本上可以达到高清的效果了。在日本,也把这个卡通的放大,也是有很好的效果。

2016年的时候,推特跟谷歌密集做了几篇文章,就是做超分辨率的。实际上就是用深度学习,实际上这件事情就是怎么样开始?2014年做的超分辨率,2015年有做了一篇,把这个速度加上去了。2016年又做了两篇,取得了比较大的突破。2017年我们紧接着又做了三篇,目前再到实时以及效果实用化的阶段。目前可以看到最好开创性的工作也是做的。实时的监控,公安监控摄像头可以把人看的比较清晰了。

这是实际的产品方向的开发,有自动驾驶,有六个方面的技术,有30多个核心的技术。我在这里面就简单举几个例子做演示。这是车的检测,这是人的实物检测?这是路的检测,这是实时的分割,我们也做到前端,用前端的芯片做实时的效果。对人的标清的互动以及手势的互动。

这是在人脸的布控系统,这已经在很多城市实时布控了。这相当于百米之外抓人,百米之外看到一个目标拉近然后进行人脸识别。这是百米外抓车,可以把这个人进行人脸识别,这是百米外的人群,把人群一个人进行识别。这是视频结构化,把视频里面的车以及特性都检测出来了,标注出来了,这样把整个视频变成了文件和文档,就可以进行文档性的搜索。这是在中国移动的实名认证系统,去年跟中国移动做了三亿人的视频认证,这是小米的宝宝相册,这是华为的智能相册,这是FaceU做的特效,微博这样特效绝大部分都是我们进行人脸识别、人的跟踪的技术做出来的。实际上在人工智能落地方面我们做了蛮多的落地产品,去年的双创活动中几百家企业里面选了两家代表中国人工智能,右边是百度,左边是商汤科技。

在中国创业是一个什么感受?我觉得中国创业就像跑百米一样,要跑的非常快,第一个到达终点才可以活下来,但是这个跑道是满地都是坑的跑道,要不然跑到最快,要不然还没有起步就掉坑里面就死掉了,这个困难肯定是有的。年轻人要不要创业?尽管这个坑还是比较多,但是创业还是可以试一试的,我给一个忠告用什么钱可以创业,什么钱可以用,什么钱不可以用,那首先你父母的钱你不可以用,你自己第一桶金可以用,烧完了之后你们还可以继续用。投资人的钱,投资人的钱肯定是可以用的,因为这都是有钱人的钱,都是这些大佬,都是非常过净值的钱,我觉得劫富济贫人人有责,大家还是出来创业吧。谢谢大家。

主持人:感谢汤老师的精彩分享,汤老师一直是我创业道路上的偶像,接下来有请陈健博士,他是北京并行科技股份有限公司的董事长,CCF中国计算机学会理事。他给我们带来的主题是科研成果工程化之路,行业计算云平台。

陈健:根据我们听到了非常精彩的人工智能方向的分享,我们人工智能发展非常好,背后有两个技术得到了巨大的突破。第一个是大数据,第二个是高性能计算。体验是科目成功工程化之路,在座都是有非常好的技术,这个技术怎么样能够非常快转化为生产力,能够在我们行业,在我们产业里面真正的起到作用,我们现在找到非常有效的方法,就是我们使用面向这种行业的计算的云平台的方式,所以下面给了一个词叫做HPC/AI In Cloud,创业者需要关注是你的算法以及应用上,至于其他所有的环节,像云平台等等都可以由这个平台来完成。我是CCF总部的秘书,今天是分主席。我负责两个论坛,一个是分论坛一个企业的论坛。昨天做了一件事情,怎么样能够让企业跟我们有技术的人有快速对接,这样也是一个平台。我们提供这个平台是并行科技,新三板的一个挂牌的公司,现在并行科技我们正在做的一件事情就是CNG中国网格运营管理中心,有中国国家网格运营管理中心,去年十月份中国网罗运营中心和并行科技成立了一个公司。整个中国国家网格有什么资源,在中国我们其实已经知道有非常多的超算,中国超算中国的量已经是世界第一了,大家看参考消息也已经看到了美国的报道,说中国超算的发展会威胁到美国的安全。超算中心的硬件设施应该说在全世界处于第一位的,但是我们所有的用户或者说创业者以及行业用户能够非常方便使用这些资源,在中国目前还没有得到一个非常好的解决。现在最好的方法就是中国国家网格大家熟知所有的系统全部在中国国家网格里面有非常多的计算能力和存储能力,大家说这个机器不是在国家网格里面,有一万台超过人工智能的服务器,比如说一台M408K机器可能需要40万人民币,这对于一个普通起步创业者或者计算小单位用户来说,这是一个很昂贵的投入。但是实际上在这样的平台上,大家可以用非常低廉的价格随需使用。具体到我们需要做的事情,我们分了四个阶段,帮助我们的用户能够把这样的计算设备,我们讲的买好。第二件事情,建好,建是一个混合的方式,自己的系统自己用,当你资源不足的时候非常方便使用超算的公有云的平台,中国国家网格。第三件事情就是怎么样管好以及第四件事情怎么用好?用好就是我们所说的计算的一个公共的服务,这儿我们提供了这样的一个方式,所有的硬件的资源其实都在对用户来说一个桌面的形式里面出现。中间有四张图,第一张图是对于用户来说我们可以非常简单,登陆一个网址输入自己的帐号密码直接可以访问你所想访问任何一套系统,包括上万台AI的服务器,第二张图是我们自己的算法可以很方便的集成到这样一个平台里面,自己使用且可以发布到全国甚至全球的用求使用,左下角的图是我们如何解释这样的一个云平台跟你自己本地的系统它的数据传输问题。两个办法,第一如果你的数据量足够大,一条光纤直达,同时直达全中国所有超算中国。第二,如果你的数据量不够大,给了一个快传的方法,这个协议可以保证你的数据非常高效。更多的应用实际上在第四张图里面,都是提供全方位的支持。右上角有二维码,大家有兴趣就可以扫码增加微信码,大家可以申请一个帐号拿到非常方便的人工智能的资源,高性能计算的资源。做这个基础上其实还做了一件事情,叫做ParaPaas,保证用户的开发侧生产云平台,你不需要做什么投入,只需要专注在自己的业务上,将来就可以发布出去,让所有人都可以使用。

相当于把底层搭好,负责所有系统支撑各种各样的运用以及在这个基础智商,我们可以提供各种各样展示的方式,以辅助你对整个系统的支持。这样的情况就是全国我们认为能够找到计算资源,通过一个网络汇成标准公有的云平台,对于全中国企业用户和个人用户可以在这样一个平台上直接访问,而你不需要关注你的硬件系统在哪儿,你的平台在哪儿,只需要关注自己的结果上就可以了。而这个网络本身是一个智能的运营外加全方位的服务。

我的介绍就到这儿,谢谢大家。

主持人:感谢陈博士的精彩分享。接下来让我们走进与你我息息相关的主题,随着城市的迅速发展,交通用度与污染日益严重,交通事故频繁发生。这些是各大城市亟待解决的问题。接下来有请陈拥权来分享。

陈拥权:非常感谢主持人给我这样一个机会。我今天主要是结合我们自己的创业,在交通领域怎么样把技术真正转化到产业里面,给大家做一个汇报。刚才通过赵沁平院士以及汤晓鸥的报告大家可以看到机会还是非常多的,从产业的规模在不断的增大,从云、大数据,从各个业务系统的投入,我们做了一个分析,应该说在2016年、2017年在交通行业肯定突破前亿的。另外一方面,政府观念在转变,传统政府以IT继承以及政府设备采购进行项目招标,2016年开始政府在大数据云平台建设方面,突破了原来的集成以及设备采购理念,现在政府也在转型,怎么样管控到服务,从信息的战略规划到云平台、高大数据平台的建设,现在应该是一个新的突破,特别是最近一些项目的投入,我们应该能够切身体会得到。PPP这个模式出来之后,比如说最近湖南的湘潭,政府投了将近30亿建大数据平台,而不是说简单的什么智慧城市、平安城市,做这样的项目招标。另外一个方面的突破,在部门的设计上,最典型的就是内蒙古,刚刚成立了一个大数据局,原来在广东是有大数据局的,但是它只是设在工信部门,在最多是一个副厅级的单位。第一次设立了大数据,正厅级的配置,由省委副秘书长调任大数据的局长,现在其实政府从结构智能合置上也进行服务型的转型。

现在的机会肯定是巨大的,但是在行业里面还存在着需要解决和贯通的问题。我总结了政产学研用割裂,2C的行业比较好解决。因为用户的需求比较明确,特别站在移动互联网的时代,用户需求可以直接反馈到商家,商家可以根据用户需求进行定制,重新的设计产品,重新转化产品形态。在交通行业,其实政府是处在两端的政产学研用,政府是决策者也是投入者,也是最后的用户,当然他服务是为居民的。整体还处在比较割裂的状态,刚才看到汤晓鸥老师的报告,CCF里面计算机视觉包括人工智能相关的研究,比例是比较高的,优秀的成果包括论文在国际上目前都处在第一梯队里面,另外一方面是在政府的业务,具体的需求里面,我们还没有做的那么细,政府还是停留在对集成商以及设备商的集成阶段,数据以及人工智能没有哪一个商家真的走入到政府的决策里面,从更高的层面深入到政府的平台甚至说业务部门去,到目前为止政府虽然说在加大转型,我们看到的还是由集成商和设备商主导,因为很难拜托现在的简单的工程招标和设备招标的模式,洛伊往往数据或者服务的转型还是在由他们主导的。导致的结果是过度IT化,不同集成商把不同项目进行招标增大产出,信息孤岛和烟筒越建越多,就导致了后面真正建一个统一服务平台的难度越来越大。各个部门特别还涉及到权利的分配和重新定义,所以配合度和协调度上其实是非常复杂的。

交通里面怎么做?城市的交通,我们列了一张图,跟几个城市做大数据规划咨询里面整理出来一系列的需求,错中复杂,真的想在一个城市里面做进去的话非常复杂,所以在这个里面我们只是选细分的,从集成设计、设备提供等等这是一个大的生态。以高速为例,高速比我们想的复杂得多,比如说高速的硬件设施投入是高管局基础的建设,但是真正运用高速管理部门和公安部门、交警们双重使用。比如说以我们在附近的省为例,高管局管了整个省二分之一的公路,但是高管局26000多人,每年的投入有一百多个亿,所以每一个科级部门的配置上权力极其巨大。

结合这个特点,在技术层面我认为提炼出来无非就是人车物和它的业务信息的结合,更多的还是怎么样把这些非结构化的数据和它当前的数据进行分类,比如说高管局、业务部门提供的,比如说给公安部门进行执法的相关的应用,所以最简单的是接入了一个治理偷逃费的系统。交通治理偷逃费比我们想的复杂得多,一个小车大家可能习惯跑一个车也有一两百块钱交费,对于一个大车而言穿一个省5-6万的交通费用,这个偷逃费的动力特别足,所以我们现在真正查出来的偷逃费的方法有一百多种怎么样布防。传统只是抓到车牌,有车牌遮挡这只是我们一种。比如说大货车,临到收费处就是猛的刹车,这样100吨多50吨,载重车和空车一波一样,最后空车拿着载重车的车牌就近下去了,载重又长距离地跑,偷逃费也是很复杂,怎么样把计算机视觉,进行车辆精细化识别和业务结合起来。路径,高速里面一般都是最短路径,从哪个收费站上两点之间最短,其实很多火车经常绕几圈,有了为了绕路,有的在不同地点偷着卸货,违规。有很多ETC,有比如说广东实现了带GPS的模块,要黏到玻璃上是拿不掉,大悲不允许走ETC,但是大车把小车的玻璃上贴上,从ETC通道走。比如说一个市里面经常以十亿为单位进行数据量的搜集,越是投入视频采集设备最后数据处理能力越弱,比如说杭州投入一百亿建智慧交通,建设完成杭州就超越了北京,成为全国最堵的城市之一,对于我们而言怎么样把这个计算机视觉技术真的产业化落地,核心还是找到实际的应用场景,这两年事实上一方面在做技术的集成,把最好的技术转化为产品和解决方案,另外一方面更多还是深入的场景里面,让最好的技术真的去解决行业,解决实际应用场景遇到的痛点和问题。我们认为这个视频大数据产业化的观念,还是找到切合的应用场景。

好,谢谢大家。

主持人:感谢陈拥权先生的分享。

【对“【硅谷速记】2017CCF青年精英大会部分实录上”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
·2019年网络安全生态峰会:支付宝芮雄文专访速记
·2019九号机器人AI产品发布会速记实录-创造AI运力
·硅谷速记:2019小满科技新品牌和新产品发布会实
·【硅谷速记】美国硅谷不靠英雄,但坚决淘汰平庸
·【硅谷速记】2019年6月11日格力电器媒体采访全记
·nokelock 2019 全球新品发布会全程文字速记实录
·【硅谷速记】牛电科技媒体沟通会-2016年4月6日
·GrowingIO 2018增长大会主会场上午现场速记实录
头条
·【硅谷速记】张小龙:全面阐述小程序来了!
图文
2018国际文创产业合作伙伴大会9月11日上午实录
2018国际文创产业合作伙伴大会9月11日上午
RTC 2018实时互联网大会之声网媒体沟通会实录
RTC 2018实时互联网大会之声网媒体沟通会实
2018国际文创产业合作伙伴大会9月11日上午实录
2018国际文创产业合作伙伴大会9月11日上午
RTC 2018实时互联网大会之声网媒体沟通会实录
RTC 2018实时互联网大会之声网媒体沟通会实
最新
·第二届河北国际工业设计周开幕式主旨演讲实录
·2019年九号机器人AI产品发布会全程文字实录
·2019烯旺科技医疗成果发布暨招商大会全程文字实录
·2019年网络安全生态峰会:支付宝芮雄文专访速记
·2019九号机器人AI产品发布会速记实录-创造AI运力
热点
·【硅谷速记】特朗普就职演讲全文(中英对照版)
·nokelock 2019 全球新品发布会全程文字速记实
·2018国际文创产业合作伙伴大会9月11日上午实
·【硅谷速记】家园网马永才接受硅谷网等群访录
·GrowingIO 2018增长大会主会场上午现场速记实
旧闻
·2018 AGM X3喜马拉雅新品发布会媒体群访速记
·首届“数字营销在线选型节”新闻发布会全程实
·【硅谷速记】苏宁易购418家电3C狂欢节发布会
·【硅谷速记】推想科技人工智能医疗平台发布会
·【硅谷速记】2018年中国TMT行业“领秀榜”盛
广告
硅谷影像
2018国际文创产业合作伙伴大会9月11日上午实录
2018国际文创产业合作伙伴大会9月11日上午实录
RTC 2018实时互联网大会之声网媒体沟通会实录
RTC 2018实时互联网大会之声网媒体沟通会实录
【硅谷速记】GMIC北京2018:知乎李大海演讲实录
【硅谷速记】GMIC北京2018:知乎李大海演讲实录
【硅谷速记】GMIC北京2018上苏宁乔新亮演讲实录
【硅谷速记】GMIC北京2018上苏宁乔新亮演讲实录
【硅谷速记】UC光谱计划开放平台发布会实录
【硅谷速记】UC光谱计划开放平台发布会实录
【2017CCF青年精英大会】汤晓鸥谈人工智能明天
【2017CCF青年精英大会】汤晓鸥谈人工智能明天
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2020 硅谷网. 版权所有. All Rights Reserved. <京ICP备12003855号-2>