阿里新零售赛道明星落下帷幕,明星齐聚,陪伴新零售之路
06-17
雷锋网:本文整理自金山CEO、金山云CEO张宏江在CCF-GAIR全球人工智能与机器人峰会上的演讲。
为什么人工智能这几年进步如此之快?张宏江认为,这最终要归功于大数据的进步和云计算的发展。
AI的支撑:数据爆炸 人工智能的进步很大程度上得益于数据的进步。
全球产生和消耗的数据每年将增长10倍,年增长率为40%。
微信朋友圈每天交换的图片数量达到10亿张。
。
张宏江举了个例子:如果小米用户在小米云上保存了超过5亿张照片,则需要1万个核心和P存储空间。
如今,中国的照片库每年价值一亿张。
这时候需要的存储空间和计算量是巨大的。
20年前梦想的手机应用程序可以对人脸进行一系列处理,例如人脸识别和年龄确定。
这不是由手机完成的,而是运行在手机后端的云端。
手机拍照后,在云端进行处理并返回结果。
这是张宏江及其团队20年前的梦想。
张宏江团队2016年在惠普实验室申请的一项专利是分布式架构。
从客户端获取数据,然后传输到后端系统,进行一系列处理,并将结果推送到前端。
20年后的今天,这个东西终于可以在手机上实现了,更重要的是终于可以在云端和终端上实现了。
手机成为数据采集终端,云作为整个计算载体和整个数据的载体。
人脸识别技术的历史就是人脸数据库扩展的历史。
这是人脸数据库+计算能力的扩展历史。
在学术时代,当面部识别在20世纪90年代初完成时,所有学术时代使用的数据库都只有几百人的面部照片。
在这种情况下,机器人的识别能力仍然比人类低很多,而且对光线的要求非常高,需要正面图像。
工业时代,海量人脸识别率2018年达到97.35%,2018年达到99.63%。
目前国内企业使用标准照片一万多张,其他照片一亿张。
人们使用的深度网络已经超过了30层,并用20个NVIDIA块进行了训练。
准确率已经远远超过了人类。
人工智能+大数据+云:正在成为企业的标配。
企业没有大数据就很难生存,而大数据又是靠云来支撑的。
大数据包括高质量数据的获取和分析,其在应用中的整个分析已日益成为公司标准。
当然,这一切都必须有云的支持。
没有云,就没有大数据,也就没有大数据的获取、处理和运营。
在介绍了云计算的应用场景后,张宏江谈到了云计算和大数据在医疗、政务、游戏、视频云、硬件云、混合云等领域相对成熟的应用。
云计算趋势 张宏江提到,云计算已成为主流IT技术。
互联网行业最成熟的公司,以及销售额迅速达到1亿美元的公司,C端是谷歌和Facebook,B端大部分是亚马逊AWS。
当B端达到如此高的销量,就意味着市场已经成熟。
人工智能威胁与人工智能2.0 现场问答环节主要围绕人工智能未来是否会对人类构成威胁,以及人工智能2.0进行。
张宏江说,第一个问题是这里有一条曲线。
在它达到奇点之前,人们无法看到它,也无法判断它。
对于人工智能2.0的问题,他认为人工智能2.0不一定是由人类驱动的。
人工智能强大的标志是能否推理问题。
未来人类可能不需要等到对人脑有了很好的了解才去做人工智能,或者说2.0。
最后,张宏江总结道:我们在人工智能领域,当我们看到人工智能作为一种现象的快速进步和突破时,我们应该更加关注它的后端,不仅仅是算法本身的快速进步,而是更重要的是,对这个算法的支持大数据和云计算正在突飞猛进,所以我们看到的未来是前端的一系列智能设备,它的大脑实际上在云端。
以下为张宏江讲话实录。
今天我想讲的是我从产业角度对人工智能的看法,以及为什么人工智能这几年发展得这么快。
最终我将其归功于大数据的进步和云计算的发展。
我们这里的大多数人都非常清楚。
相信有些人可能在今年3月的AlphaGo和李世石身上第一次注意到了人工智能的精彩。
游戏的第一局,我和一些正在做研究的朋友一起玩。
打赌之后,谁赢谁输。
最后,我很幸运地押注在机器人上,所以我最终在AlphaGo上赢了很多钱。
我们已经看到了人工智能50多年的历史。
我们看到The Buzz击败俄罗斯高手后没有任何进展。
突然有一天我们看到AlphaGo以4比1的比分击败了世界上最好的高手。
大家可能会说算法取得了很大的进步,但我认为更重要的是大数据的进步,超级计算和云计算。
我今天不想讨论 AlphaGo 使用什么算法。
我想分享的是其背后的数据以及其背后的高性能计算资源。
在比赛之前,它已经获得了人类6到9级棋手的比赛数据。
训练量已经相当大了,它可以毫无感情地与自己下棋,并且获得了数万个落点数据,这对于人类棋手来说是很难做到的。
实际下棋时,系统本身所需的计算资源,包括多个CPU和多个GPU,消耗的能量是人类的许多倍。
这是在阿尔法狗和人类之间的比赛之前。
人们对阿尔法狗的评价,最高的设定,它的等级已经达到了这样的数字,但是如果我们看看人类的高手,当时给它的数字是,李世石与之前相比,你会认为高手或许还是会赢,但让人没想到的是,机器人在这个过程中学得这么快。
人工智能的进步很大程度上得益于计算的进步。
如果看近几年互联网的快速发展,全球产生和消费的数据每年都会增长10倍,年增长率达到40%。
当互联网突飞猛进的发展,特别是移动设备的快速发展时,我们看到照片的数据增长得如此之快。
前面用的是美国一些知名网站。
不幸的是,我无法获取大部分国内网站的数据。
可以看到,每天上传分享的图片数量已经超过10亿张。
我从2019年开始关注小米手机的数据,到今年年初,它的日上传图片数据已经破亿。
前段时间,马化腾提到,今天,微信朋友圈每天交换的图片数量是10亿张。
人们可能不太关心10亿这个数字,但20年前,中国每年的电影消费量是40亿,是历史最高的一年。
拍了40亿张照片,今天是微信四天的交流量。
这是一个简单的量变带来的质变,尤其是我们在做神经网络的时候遇到的第一个问题,我们得到了非常好的解决方案。
我们再来看另外一个具体情况,因为这个数据是我自己从系统里取出来的。
简单的把这些数据做成一个序列图,这样下次再往下看的时候,整个照片就不会一开始就摇下来了。
这需要2.6G的CPU和T的存储空间。
如果小米用户在小米云上保存的照片超过5亿张,则需要1万个核心和P存储空间。
然而,今天中国的库存照片,即年度数据,将需要1亿张照片。
存储空间和计算量如此巨大。
正是因为有如此大量的图片,我们以前认为不可能的神经网络训练任务今天可以相对轻松地完成。
右图是《纽约时报》2016年报道的一个作品,是如何让计算机自动识别猫的脸。
它使用的数据和我们之前在AR中讲的基本一样,是一种野蛮的力量。
0 个处理器制作了 10,000 张照片。
今天的数字是一年的数字。
今天的数字对我们来说已经是小菜一碟了。
如今手机上的应用,大家使用手机的时候,手机可以对人脸进行一系列的处理。
一开始,人们总是想在手机上做一些很酷的事情,比如通过照片猜测年龄。
这就是小儿科,我们20年前就有这个想法,今天终于在手机上实现了。
以前我们拍的照片太多,只能按照时间和地点来查找。
今天用人脸检测,我打开人脸,这是我的照片,所有跟我有通讯录的人的照片都在。
出来的时候,我点开雷军的照片,所有与雷军相关的照片都出来了。
我们再看另一种人多的情况。
当他第一次见到一些人时,我以前没有标记过这些人,他们也没有出现在我的朋友圈中。
它会询问您有关这些人的信息。
到底是谁啊,整个系统,今天不仅仅是小米手机,只要这些东西有云功能,只要背后有支持云的手机,今天做到这一点并不难。
什么样的力量,什么样的进步,让今天做这种事情显得那么容易,或者说人们觉得手机的功能那么强大,但是我想告诉大家,这不是手机能做到的,这就是手机之后的情况。
端上的云端正在做,因为手机拍照的时候,在云端进行处理,很快就返回结果。
这是我们20多年来的梦想。
我有一个数字可以证明这一点。
这是2008年惠普的一项实验,并申请了专利。
工作于当年完成,最终专利于当年获得批准。
我们来看两张图片。
第一张图是人脸识别对比图。
第二张图是我们20年前的架构。
也就是说,这是一个分布式架构。
从客户端获取数据,然后传输到后端。
一系列流程在端系统完成,结果推送到前端。
20年后的今天,这个东西终于可以在手机上实现了,或者更重要的是,终于可以在云端和终端上实现了。
手机和云作为数据采集终端,作为整个计算载体和整个数据载体,终于实现了我们20年前的梦想。
不幸的是,因为这个专利是2010年申请的,一天后就会失效,所以我没办法帮他们索要专利费。
我刚才说了这么多,从学术角度来说,我认为人工智能这20年的发展,特别是人脸识别领域的进步,其实可以归功于一个数据库的扩展。
20世纪90年代,我们90年代初做鬼脸的时候,学术时代用的数据库都是几百人。
因为数据量很小,可以说它的识别率是95%到99%,但即便如此,机器人的识别能力仍然比人类的识别能力低很多,而且光线要求非常高,而且图像必须是正面。
当我们看到随着数据的增加,再过十年,我们会看到这些照片已经从几千人,到近万张照片。
这时,识别能力得到了进一步的提升,对表情、光线的识别等的要求就没有那么严格了。
进入新年后,数据量爆发式增长。
这时候互联网开始流行,而且量如此之大。
到了LFW的数据积累时,已经和人几乎一样了,这进一步将识别率提高到了95%以上。
到时候业界加入进来,当学术界真正开始突破的时候,它的训练数据就找到了更多的训练。
在真正的人脸识别时代,业内人士认为这个问题可以变得现实。
当行业开始进入的时候,此时的数据量和学术界的数据量不是一个数量级的。
Facebook和Deepface已经达到了4.4M一张图片,一个人,每人一张图片。
到Google和FaceNet的时候,已经有2亿张图片,1万人,参数已经超过0万个参数。
如果我们看一下这部作品,这里也非常明显。
当我们的训练量开始增加时,同一个模型的准确率的提高是非常相关的。
当然,当数据量比较小时,增加一个数量级时,提升会比较小。
只需要增加一个数量级,就能实现小数点后一位数的增加。
当我们研究算法时,这同样适用。
当算法变得越来越准确时,您所需的计算能力也迅速增加。
我们还可以看到,当计算复杂度超过十亿浮点数时,我们可以看到检测精度的提高。
我们来看看真实的行业,靠人脸识别谋生的公司,以及近年来的进展。
我举了两个例子,商汤科技和依图科技。
从他们那里获得的数据基本上是关于中国人口的。
数据,一万多张标准照片加上一亿张其他照片,人们使用的深度网络已经超过了30层,训练了20个NVIDIA训练块。
如今的准确度已经远远超过了人类。
如果你今天想做坏事,只要留一张照片,基本上是逃不掉的。
这是当今商业解决方案已达到的精度水平。
我还是想强调一下,如果没有那么多照片,尤其是在中国的环境下,当所有的网上行为都连接在一起的时候,你会发现判断的准确性会大大提高。
我们再看一下。
当我们的数据、识别精度和算法变得如此庞大,从四年前的80%网络到今年的层识别时,我特地拿到了这个数据。
如今,神经元的数量已经达到一万个,最后下降到一万个。
当我们拥有大数的野蛮力量时,我们会给人工智能带来什么?所以我说数据是我们进步的核心,我们有句话说,数据永远不会太多,也永远不会足够。
特斯拉声称,每天有 17 万辆汽车在路上行驶,以帮助其收集数据。
但当强光照射时,就会造成误判。
所以当我们谈论大数据时,我们总是谈论要解决的问题。
。
只有当你比较简单的时候,少量的数据就可以满足你的要求。
当您使用复杂模型时,数据量必须远远超出您的训练需求。
数据越多,覆盖精度越高。
对模型的依赖将会减少。
在大数据方面,微软走得很早。
我们非常尊敬的 Michael Wooldridge 先生十年前就提出了可学习范式的概念。
从牛顿力学到几百年前,我们都使用理论方法。
解释一下,今天我们用数据来驱动它。
这本书出版于2011年,我确实认为,在我们进入第四范式的今天,数据在我们日常工作和研究中的作用是以前完全无法比拟的。
大数据包括高质量数据的获取和分析,其在应用中的整个分析已经越来越成为企业的标准。
如果你是一家大公司,你没有大数据分析,或者没有办法获取大数据。
数据,或者说如果你不把这些大数据转化为专家,你实际上很难在你的行业生存。
当然,这一切都必须有云的支持。
没有云,我们就谈不上大数据,也谈不上大数据的获取、处理和运营。
这就是为什么我们今天看到一系列云公司,尤其是大型云公司,越来越强调数据存储和处理。
金山软件很早就进入了云存储和云数据分析领域。
无论是原始数据、图片还是视频,每天都会处理大量的数据。
然后将生成器大量存储在云端,然后由云端进行处理和分析。
这就需要大量的资源才能真正消费掉我刚才提到的数据,比如人脸识别,这是我们20多年前就梦想解决的问题。
我们今天看到的大多数智能平台,无论是消费类智能平台还是工业智能设备,智能程度都非常低。
他们的情报隐藏在后端云中。
大家都知道,人工智能现象在这几个月的网红视频直播中也出现了。
这些公司之所以能一夜崛起,是因为其背后的支撑技术,是多年来从事采集、编解码的。
一切都已经由视频云计算公司提供了,所以你想做网红直播,只需要找一个网红,搭建一个网站,写一个APP,后端的一切事情将由云提供。
同样的医疗,今天中国的医疗问题那么多,精准医疗、精准康复谈不上。
只有基于大数据云平台将这些系列连接起来,才能实现我们所说的精准医疗、精准康复、社区医疗。
。
今天也在这座城市,我们有大华公司的代表。
众所周知,里约奥运会上,大部分摄像机都是来自大华,每天收集的数据非常多。
这是智慧城市的核心。
一部分是当你把这些数据运用起来、利用起来的时候,你才能真正感受到这些数据的价值。
同样,对于游戏来说更是如此。
手游这么好玩,背后都是智能分析,所以什么时候推出游戏、什么时候推出新服务等等,这一切都是由背后的数据驱动的。
。
说了这么多,但是大家还是有疑问,那就是云计算是否还在云端。
我告诉大家,今天云计算已经真正实现了。
这是 Gaslnes 的年度技术成熟度分析。
同样,市场对云计算公司的看法也非常非常乐观。
如果我们回顾过去30年互联网上增长最快的公司,我们用一个数据来衡量哪些公司在最快的时间内达到了1亿美元。
显然互联网公司的速度很快。
一个叫 Facebook,另一个叫 Google。
十年内销售额达到1亿美元的2B公司只有一家,那就是亚马逊云。
当2B业务追上2C业务的时候,你就知道人们的需求有多大。
当然很大,具体细节我就不说了。
事实上,市场的反应非常明确。
当你在云上快速投资、在云中快速增长股票时,你可以看到市场给出了最好的回报。
同样,对于我们这些在中国从事人工智能工作的人来说,这个数字是非常令人鼓舞的。
如今,中国的互联网产值只有美国的百分之几。
我们思考的是未来几年云计算行业的空间和增长。
速度这么快,这也是金山软件这几年投入这么多资源的原因,让我们成为中国的云计算服务商,成为国内游戏云、视频云、智能硬件等领域的领先企业。
市场的增长速度实际上比我们想象的要快。
我的结论是,当我们从事人工智能工作时,当我们看到人工智能作为一种现象的快速进步和突破时,我们应该更加关注它的后端,不仅仅是算法本身的快速进步,更重要的是,对这个算法的支持随着大数据和云计算的快速推进,所以我们看到的未来是前端的一系列智能设备,它的大脑实际上是在云端。

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-17
06-17
06-06
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态