首页 > 科技未来 > 内容

AIR 004丨金山CEO张宏江:智能、大数据、云

发布于:2024-06-18 编辑:匿名 来源:网络

雷锋网:本文整理自金山CEO、金山云CEO张宏江在CCF-GAIR全球人工智能与机器人峰会上的演讲。

为什么人工智能这几年进步如此之快?张宏江认为,这最终要归功于大数据的进步和云计算的发展。

AI的支撑:数据爆炸 人工智能的进步很大程度上得益于数据的进步。

全球产生和消耗的数据每年将增长10倍,年增长率为40%。

微信朋友圈每天交换的图片数量达到10亿张。

张宏江举了个例子:如果小米用户在小米云上保存了超过5亿张照片,则需要1万个核心和P存储空间。

如今,中国的照片库每年价值一亿张。

这时候需要的存储空间和计算量是巨大的。

20年前梦想的手机应用程序可以对人脸进行一系列处理,例如人脸识别和年龄确定。

这不是由手机完成的,而是运行在手机后端的云端。

手机拍照后,在云端进行处理并返回结果。

这是张宏江及其团队20年前的梦想。

张宏江团队2016年在惠普实验室申请的一项专利是分布式架构。

从客户端获取数据,然后传输到后端系统,进行一系列处理,并将结果推送到前端。

20年后的今天,这个东西终于可以在手机上实现了,更重要的是终于可以在云端和终端上实现了。

手机成为数据采集终端,云作为整个计算载体和整个数据的载体。

人脸识别技术的历史就是人脸数据库扩展的历史。

这是人脸数据库+计算能力的扩展历史。

在学术时代,当面部识别在20世纪90年代初完成时,所有学术时代使用的数据库都只有几百人的面部照片。

在这种情况下,机器人的识别能力仍然比人类低很多,而且对光线的要求非常高,需要正面图像。

工业时代,海量人脸识别率2018年达到97.35%,2018年达到99.63%。

目前国内企业使用标准照片一万多张,其他照片一亿张。

人们使用的深度网络已经超过了30层,并用20个NVIDIA块进行了训练。

准确率已经远远超过了人类。

人工智能+大数据+云:正在成为企业的标配。

企业没有大数据就很难生存,而大数据又是靠云来支撑的。

大数据包括高质量数据的获取和分析,其在应用中的整个分析已日益成为公司标准。

当然,这一切都必须有云的支持。

没有云,就没有大数据,也就没有大数据的获取、处理和运营。

在介绍了云计算的应用场景后,张宏江谈到了云计算和大数据在医疗、政务、游戏、视频云、硬件云、混合云等领域相对成熟的应用。

云计算趋势 张宏江提到,云计算已成为主流IT技术。

互联网行业最成熟的公司,以及销售额迅速达到1亿美元的公司,C端是谷歌和Facebook,B端大部分是亚马逊AWS。

当B端达到如此高的销量,就意味着市场已经成熟。

人工智能威胁与人工智能2.0 现场问答环节主要围绕人工智能未来是否会对人类构成威胁,以及人工智能2.0进行。

张宏江说,第一个问题是这里有一条曲线。

在它达到奇点之前,人们无法看到它,也无法判断它。

对于人工智能2.0的问题,他认为人工智能2.0不一定是由人类驱动的。

人工智能强大的标志是能否推理问题。

未来人类可能不需要等到对人脑有了很好的了解才去做人工智能,或者说2.0。

最后,张宏江总结道:我们在人工智能领域,当我们看到人工智能作为一种现象的快速进步和突破时,我们应该更加关注它的后端,不仅仅是算法本身的快速进步,而是更重要的是,对这个算法的支持大数据和云计算正在突飞猛进,所以我们看到的未来是前端的一系列智能设备,它的大脑实际上在云端。

以下为张宏江讲话实录。

今天我想讲的是我从产业角度对人工智能的看法,以及为什么人工智能这几年发展得这么快。

最终我将其归功于大数据的进步和云计算的发展。

我们这里的大多数人都非常清楚。

相信有些人可能在今年3月的AlphaGo和李世石身上第一次注意到了人工智能的精彩。

游戏的第一局,我和一些正在做研究的朋友一起玩。

打赌之后,谁赢谁输。

最后,我很幸运地押注在机器人上,所以我最终在AlphaGo上赢了很多钱。

我们已经看到了人工智能50多年的历史。

我们看到The Buzz击败俄罗斯高手后没有任何进展。

突然有一天我们看到AlphaGo以4比1的比分击败了世界上最好的高手。

大家可能会说算法取得了很大的进步,但我认为更重要的是大数据的进步,超级计算和云计算。

我今天不想讨论 AlphaGo 使用什么算法。

我想分享的是其背后的数据以及其背后的高性能计算资源。

在比赛之前,它已经获得了人类6到9级棋手的比赛数据。

训练量已经相当大了,它可以毫无感情地与自己下棋,并且获得了数万个落点数据,这对于人类棋手来说是很难做到的。

实际下棋时,系统本身所需的计算资源,包括多个CPU和多个GPU,消耗的能量是人类的许多倍。

这是在阿尔法狗和人类之间的比赛之前。

人们对阿尔法狗的评价,最高的设定,它的等级已经达到了这样的数字,但是如果我们看看人类的高手,当时给它的数字是,李世石与之前相比,你会认为高手或许还是会赢,但让人没想到的是,机器人在这个过程中学得这么快。

人工智能的进步很大程度上得益于计算的进步。

如果看近几年互联网的快速发展,全球产生和消费的数据每年都会增长10倍,年增长率达到40%。

当互联网突飞猛进的发展,特别是移动设备的快速发展时,我们看到照片的数据增长得如此之快。

前面用的是美国一些知名网站。

不幸的是,我无法获取大部分国内网站的数据。

可以看到,每天上传分享的图片数量已经超过10亿张。

我从2019年开始关注小米手机的数据,到今年年初,它的日上传图片数据已经破亿。

前段时间,马化腾提到,今天,微信朋友圈每天交换的图片数量是10亿张。

人们可能不太关心10亿这个数字,但20年前,中国每年的电影消费量是40亿,是历史最高的一年。

拍了40亿张照片,今天是微信四天的交流量。

这是一个简单的量变带来的质变,尤其是我们在做神经网络的时候遇到的第一个问题,我们得到了非常好的解决方案。

我们再来看另外一个具体情况,因为这个数据是我自己从系统里取出来的。

简单的把这些数据做成一个序列图,这样下次再往下看的时候,整个照片就不会一开始就摇下来了。

这需要2.6G的CPU和T的存储空间。

如果小米用户在小米云上保存的照片超过5亿张,则需要1万个核心和P存储空间。

然而,今天中国的库存照片,即年度数据,将需要1亿张照片。

存储空间和计算量如此巨大。

正是因为有如此大量的图片,我们以前认为不可能的神经网络训练任务今天可以相对轻松地完成。

右图是《纽约时报》2016年报道的一个作品,是如何让计算机自动识别猫的脸。

它使用的数据和我们之前在AR中讲的基本一样,是一种野蛮的力量。

0 个处理器制作了 10,000 张照片。

今天的数字是一年的数字。

今天的数字对我们来说已经是小菜一碟了。

如今手机上的应用,大家使用手机的时候,手机可以对人脸进行一系列的处理。

一开始,人们总是想在手机上做一些很酷的事情,比如通过照片猜测年龄。

这就是小儿科,我们20年前就有这个想法,今天终于在手机上实现了。

以前我们拍的照片太多,只能按照时间和地点来查找。

今天用人脸检测,我打开人脸,这是我的照片,所有跟我有通讯录的人的照片都在。

出来的时候,我点开雷军的照片,所有与雷军相关的照片都出来了。

我们再看另一种人多的情况。

当他第一次见到一些人时,我以前没有标记过这些人,他们也没有出现在我的朋友圈中。

它会询问您有关这些人的信息。

到底是谁啊,整个系统,今天不仅仅是小米手机,只要这些东西有云功能,只要背后有支持云的手机,今天做到这一点并不难。

什么样的力量,什么样的进步,让今天做这种事情显得那么容易,或者说人们觉得手机的功能那么强大,但是我想告诉大家,这不是手机能做到的,这就是手机之后的情况。

端上的云端正在做,因为手机拍照的时候,在云端进行处理,很快就返回结果。

这是我们20多年来的梦想。

我有一个数字可以证明这一点。

这是2008年惠普的一项实验,并申请了专利。

工作于当年完成,最终专利于当年获得批准。

我们来看两张图片。

第一张图是人脸识别对比图。

第二张图是我们20年前的架构。

也就是说,这是一个分布式架构。

从客户端获取数据,然后传输到后端。

一系列流程在端系统完成,结果推送到前端。

20年后的今天,这个东西终于可以在手机上实现了,或者更重要的是,终于可以在云端和终端上实现了。

手机和云作为数据采集终端,作为整个计算载体和整个数据载体,终于实现了我们20年前的梦想。

不幸的是,因为这个专利是2010年申请的,一天后就会失效,所以我没办法帮他们索要专利费。

我刚才说了这么多,从学术角度来说,我认为人工智能这20年的发展,特别是人脸识别领域的进步,其实可以归功于一个数据库的扩展。

20世纪90年代,我们90年代初做鬼脸的时候,学术时代用的数据库都是几百人。

因为数据量很小,可以说它的识别率是95%到99%,但即便如此,机器人的识别能力仍然比人类的识别能力低很多,而且光线要求非常高,而且图像必须是正面。

当我们看到随着数据的增加,再过十年,我们会看到这些照片已经从几千人,到近万张照片。

这时,识别能力得到了进一步的提升,对表情、光线的识别等的要求就没有那么严格了。

进入新年后,数据量爆发式增长。

这时候互联网开始流行,而且量如此之大。

到了LFW的数据积累时,已经和人几乎一样了,这进一步将识别率提高到了95%以上。

到时候业界加入进来,当学术界真正开始突破的时候,它的训练数据就找到了更多的训练。

在真正的人脸识别时代,业内人士认为这个问题可以变得现实。

当行业开始进入的时候,此时的数据量和学术界的数据量不是一个数量级的。

Facebook和Deepface已经达到了4.4M一张图片,一个人,每人一张图片。

到Google和FaceNet的时候,已经有2亿张图片,1万人,参数已经超过0万个参数。

如果我们看一下这部作品,这里也非常明显。

当我们的训练量开始增加时,同一个模型的准确率的提高是非常相关的。

当然,当数据量比较小时,增加一个数量级时,提升会比较小。

只需要增加一个数量级,就能实现小数点后一位数的增加。

当我们研究算法时,这同样适用。

当算法变得越来越准确时,您所需的计算能力也迅速增加。

我们还可以看到,当计算复杂度超过十亿浮点数时,我们可以看到检测精度的提高。

我们来看看真实的行业,靠人脸识别谋生的公司,以及近年来的进展。

我举了两个例子,商汤科技和依图科技。

从他们那里获得的数据基本上是关于中国人口的。

数据,一万多张标准照片加上一亿张其他照片,人们使用的深度网络已经超过了30层,训练了20个NVIDIA训练块。

如今的准确度已经远远超过了人类。

如果你今天想做坏事,只要留一张照片,基本上是逃不掉的。

这是当今商业解决方案已达到的精度水平。

我还是想强调一下,如果没有那么多照片,尤其是在中国的环境下,当所有的网上行为都连接在一起的时候,你会发现判断的准确性会大大提高。

我们再看一下。

当我们的数据、识别精度和算法变得如此庞大,从四年前的80%网络到今年的层识别时,我特地拿到了这个数据。

如今,神经元的数量已经达到一万个,最后下降到一万个。

当我们拥有大数的野蛮力量时,我们会给人工智能带来什么?所以我说数据是我们进步的核心,我们有句话说,数据永远不会太多,也永远不会足够。

特斯拉声称,每天有 17 万辆汽车在路上行驶,以帮助其收集数据。

但当强光照射时,就会造成误判。

所以当我们谈论大数据时,我们总是谈论要解决的问题。

只有当你比较简单的时候,少量的数据就可以满足你的要求。

当您使用复杂模型时,数据量必须远远超出您的训练需求。

数据越多,覆盖精度越高。

对模型的依赖将会减少。

在大数据方面,微软走得很早。

我们非常尊敬的 Michael Wooldridge 先生十年前就提出了可学习范式的概念。

从牛顿力学到几百年前,我们都使用理论方法。

解释一下,今天我们用数据来驱动它。

这本书出版于2011年,我确实认为,在我们进入第四范式的今天,数据在我们日常工作和研究中的作用是以前完全无法比拟的。

大数据包括高质量数据的获取和分析,其在应用中的整个分析已经越来越成为企业的标准。

如果你是一家大公司,你没有大数据分析,或者没有办法获取大数据。

数据,或者说如果你不把这些大数据转化为专家,你实际上很难在你的行业生存。

当然,这一切都必须有云的支持。

没有云,我们就谈不上大数据,也谈不上大数据的获取、处理和运营。

这就是为什么我们今天看到一系列云公司,尤其是大型云公司,越来越强调数据存储和处理。

金山软件很早就进入了云存储和云数据分析领域。

无论是原始数据、图片还是视频,每天都会处理大量的数据。

然后将生成器大量存储在云端,然后由云端进行处理和分析。

这就需要大量的资源才能真正消费掉我刚才提到的数据,比如人脸识别,这是我们20多年前就梦想解决的问题。

我们今天看到的大多数智能平台,无论是消费类智能平台还是工业智能设备,智能程度都非常低。

他们的情报隐藏在后端云中。

大家都知道,人工智能现象在这几个月的网红视频直播中也出现了。

这些公司之所以能一夜崛起,是因为其背后的支撑技术,是多年来从事采集、编解码的。

一切都已经由视频云计算公司提供了,所以你想做网红直播,只需要找一个网红,搭建一个网站,写一个APP,后端的一切事情将由云提供。

同样的医疗,今天中国的医疗问题那么多,精准医疗、精准康复谈不上。

只有基于大数据云平台将这些系列连接起来,才能实现我们所说的精准医疗、精准康复、社区医疗。

今天也在这座城市,我们有大华公司的代表。

众所周知,里约奥运会上,大部分摄像机都是来自大华,每天收集的数据非常多。

这是智慧城市的核心。

一部分是当你把这些数据运用起来、利用起来的时候,你才能真正感受到这些数据的价值。

同样,对于游戏来说更是如此。

手游这么好玩,背后都是智能分析,所以什么时候推出游戏、什么时候推出新服务等等,这一切都是由背后的数据驱动的。

说了这么多,但是大家还是有疑问,那就是云计算是否还在云端。

我告诉大家,今天云计算已经真正实现了。

这是 Gaslnes 的年度技术成熟度分析。

同样,市场对云计算公司的看法也非常非常乐观。

如果我们回顾过去30年互联网上增长最快的公司,我们用一个数据来衡量哪些公司在最快的时间内达到了1亿美元。

显然互联网公司的速度很快。

一个叫 Facebook,另一个叫 Google。

十年内销售额达到1亿美元的2B公司只有一家,那就是亚马逊云。

当2B业务追上2C业务的时候,你就知道人们的需求有多大。

当然很大,具体细节我就不说了。

事实上,市场的反应非常明确。

当你在云上快速投资、在云中快速增长股票时,你可以看到市场给出了最好的回报。

同样,对于我们这些在中国从事人工智能工作的人来说,这个数字是非常令人鼓舞的。

如今,中国的互联网产值只有美国的百分之几。

我们思考的是未来几年云计算行业的空间和增长。

速度这么快,这也是金山软件这几年投入这么多资源的原因,让我们成为中国的云计算服务商,成为国内游戏云、视频云、智能硬件等领域的领先企业。

市场的增长速度实际上比我们想象的要快。

我的结论是,当我们从事人工智能工作时,当我们看到人工智能作为一种现象的快速进步和突破时,我们应该更加关注它的后端,不仅仅是算法本身的快速进步,更重要的是,对这个算法的支持随着大数据和云计算的快速推进,所以我们看到的未来是前端的一系列智能设备,它的大脑实际上是在云端。

AIR 004丨金山CEO张宏江:智能、大数据、云

AIR 004丨金山CEO张宏江:智能、大数据、云

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 阿里新零售赛道明星落下帷幕,明星齐聚,陪伴新零售之路

    阿里新零售赛道明星落下帷幕,明星齐聚,陪伴新零售之路

    4月8日至10日,由阿里云加速器、微信主办的阿里新零售赛道明星在杭州举行收官活动聚会上,阿里云、知名投资机构等明星明星齐聚现场,30余位标杆创新领袖共议新零售。 他们探讨了突破新零售的新思路、新方式,并探讨了风险投资和行业投资趋势。 趋势是寻找新零售创新力量,共

    06-17

  • 金价为何在连续21个月上涨后开始暴跌?

    金价为何在连续21个月上涨后开始暴跌?

    俗话说“盛世买地,乱世买黄金”。 近两年,黄金主题投资受到投资者青睐。 今年以来,黄金ETF涨幅超过10%。 龙头企业大幅上涨,老凤祥年内涨幅超53%,周大胜年内涨幅超32%。 但近期表现强劲的黄金资产却遭遇挫折。 自9月26日以来,黄金ETF已下跌5%。 个股方面,节后A股开盘首

    06-17

  • 启明创投邝子平:10年27亿美元背后的投资判断和时机

    启明创投邝子平:10年27亿美元背后的投资判断和时机

    在启明创投上海总部陆家嘴金茂大厦39层,数百名被投企业高管、投资人来到这里,前台我们总是忙于接待,所有的会议室都满了,茶室里的电脑还得由一位LP来打开。 启明创投经理合伙人邝子平接待了一批又一批的客人。 一小时后,启明创投十周年欢迎晚宴在附近的浦东丽思卡尔顿酒店

    06-18

  • 拍摄了《鱿鱼游戏》的Netflix,真正开始做云游戏了

    拍摄了《鱿鱼游戏》的Netflix,真正开始做云游戏了

    就像《鱿鱼游戏》一样,各个厂商都在拼命争夺游戏市场的立足点。 即使有人摔倒,新人也会继续参加比赛。 竞争中,老牌流媒体巨头Netflix是进入这场激烈竞争的新挑战者。 8 月 15 日,Netflix 游戏主管 Mike Verdu 在博文中写道:“从今天开始,我们将在加拿大和英国的部分电

    06-21

  • 小鹏汽车2021Q1净亏损7.9亿,同比收窄15.9%

    小鹏汽车2021Q1净亏损7.9亿,同比收窄15.9%

    创头条获悉,5月13日,小鹏汽车(纽交所:经审计的财务报表)。 财报显示,按照美国通用会计准则计算按公认会计准则(GAAP)计算,小鹏汽车一季度总营收为29亿元人民币(约合4亿美元),较去年同期的4亿元人民币增加。 市场预期为28.86亿元,高于预期,其中小鹏汽车普通股股东

    06-18

  • 聚焦科创企业,南通设立产业投资基金

    聚焦科创企业,南通设立产业投资基金

    据投资界(ID:pedaily)了解,近日,通州湾示范区联合省沿海集团、南通创新发展基金,共同设立南通通州海湾示范区海金创业投资基金。 据悉,该基金规模3亿元,已签署投资协议并完成工商注册。 据介绍,该基金的设立将根据通州湾示范区“五园一城一基地”的产业定位和布局,

    06-18

  • 达摩院成立XG实验室!阿里巴巴官宣聚焦5G技术与应用

    达摩院成立XG实验室!阿里巴巴官宣聚焦5G技术与应用

    据雷锋网报道,阿里巴巴达摩院近日宣布正式成立协同研发。 与5G基础技术相比,5G应用层的技术和生态发展相对滞后。 达摩院表示,新成立的XG实验室将依托阿里巴巴丰富的应用生态,专注于5G基础设施技术与应用的协同创新,为超高清视频、在线办公、AR/VR、工业互联网、智能家居

    06-17

  • 国家发改委:长三角一体化发展战略实施三年来取得重大成果

    国家发改委:长三角一体化发展战略实施三年来取得重大成果

    国新办召开长三角一体化发展进展新闻发布会长三角上升为国家战略三年来。 国家发展和改革委员会副主任丛良在会上表示,长三角地区创新源头能力建设不断加强,科技创新共同体建设扎实推进,创新链和创新能力不断增强。 产业链协调融合发展,资源集约利用水平和综合经济效益显着

    06-18

  • 狗粮初创公司Sundays获227万美元融资

    狗粮初创公司Sundays获227万美元融资

    投资圈(ID:pedaily)8月17日消息,据36氪报道,Sundays获1万美元融资。 本轮投资者包括 Red Sea Ventures、Box Group、Great Oaks Ventures、Matt Salzberg、Zach Klein 等投资公司。 对于新一轮融资,Sundays将利用其进一步开发公司产品,扩大业务规模,为更多的宠物和狗狗

    06-17

  • 元和原点宣布广州天使基金一期三期已竣工,刘炳乾博士晋升广州天使基金合伙人

    元和原点宣布广州天使基金一期三期已竣工,刘炳乾博士晋升广州天使基金合伙人

    投资圈(ID:pedaily)7月25日消息,元和原点宣布广州天使基金一期已完成天使基金三期已签约并宣布刘炳乾博士晋升广州天使基金合伙人。 广州天使基金合伙人刘炳乾毕业于武汉大学生物化学与分子生物学专业,康奈尔大学威尔医学院访问学者学院。 2007年7月加入元和源广州团队,

    06-18

  • 黄埔在线宣布获得保利资本数千万元战略融资

    黄埔在线宣布获得保利资本数千万元战略融资

    据投资界3月6日消息,近日,黄埔在线(北京)信息技术有限公司(简称黄埔在线) 《黄埔在线》)宣布完成数千万元战略融资融资,投资方为保利资本旗下基金。 本轮融资将用于黄埔在线心理教育、思维训练、科学教育三大业务的市场拓展和布局。 借助保利资本的投资机会,黄埔在线

    06-17

  • 欧盟-印度贸易和技术委员会与印度签署半导体协议

    欧盟-印度贸易和技术委员会与印度签署半导体协议

    资料Silicon Semiconductor 欧盟-印度贸易和技术委员会 (TTC) 联合主席兼执行副总裁 Valdis Dombrovskis 和副总统 Vra Jourov 与印度外交部长 Subrahmanyam Jaishankar与铁道、通信、电子和信息技术部长阿什维尼瓦什纳夫(Ashwini Vaishnaw)和商务部长皮尤什戈亚尔(Piyush

    06-06