首页 > 科技未来 > 内容

AIR 004丨金山CEO张宏江:智能、大数据、云

发布于:2024-06-18 编辑:匿名 来源:网络

雷锋网:本文整理自金山CEO、金山云CEO张宏江在CCF-GAIR全球人工智能与机器人峰会上的演讲。

为什么人工智能这几年进步如此之快?张宏江认为,这最终要归功于大数据的进步和云计算的发展。

AI的支撑:数据爆炸 人工智能的进步很大程度上得益于数据的进步。

全球产生和消耗的数据每年将增长10倍,年增长率为40%。

微信朋友圈每天交换的图片数量达到10亿张。

张宏江举了个例子:如果小米用户在小米云上保存了超过5亿张照片,则需要1万个核心和P存储空间。

如今,中国的照片库每年价值一亿张。

这时候需要的存储空间和计算量是巨大的。

20年前梦想的手机应用程序可以对人脸进行一系列处理,例如人脸识别和年龄确定。

这不是由手机完成的,而是运行在手机后端的云端。

手机拍照后,在云端进行处理并返回结果。

这是张宏江及其团队20年前的梦想。

张宏江团队2016年在惠普实验室申请的一项专利是分布式架构。

从客户端获取数据,然后传输到后端系统,进行一系列处理,并将结果推送到前端。

20年后的今天,这个东西终于可以在手机上实现了,更重要的是终于可以在云端和终端上实现了。

手机成为数据采集终端,云作为整个计算载体和整个数据的载体。

人脸识别技术的历史就是人脸数据库扩展的历史。

这是人脸数据库+计算能力的扩展历史。

在学术时代,当面部识别在20世纪90年代初完成时,所有学术时代使用的数据库都只有几百人的面部照片。

在这种情况下,机器人的识别能力仍然比人类低很多,而且对光线的要求非常高,需要正面图像。

工业时代,海量人脸识别率2018年达到97.35%,2018年达到99.63%。

目前国内企业使用标准照片一万多张,其他照片一亿张。

人们使用的深度网络已经超过了30层,并用20个NVIDIA块进行了训练。

准确率已经远远超过了人类。

人工智能+大数据+云:正在成为企业的标配。

企业没有大数据就很难生存,而大数据又是靠云来支撑的。

大数据包括高质量数据的获取和分析,其在应用中的整个分析已日益成为公司标准。

当然,这一切都必须有云的支持。

没有云,就没有大数据,也就没有大数据的获取、处理和运营。

在介绍了云计算的应用场景后,张宏江谈到了云计算和大数据在医疗、政务、游戏、视频云、硬件云、混合云等领域相对成熟的应用。

云计算趋势 张宏江提到,云计算已成为主流IT技术。

互联网行业最成熟的公司,以及销售额迅速达到1亿美元的公司,C端是谷歌和Facebook,B端大部分是亚马逊AWS。

当B端达到如此高的销量,就意味着市场已经成熟。

人工智能威胁与人工智能2.0 现场问答环节主要围绕人工智能未来是否会对人类构成威胁,以及人工智能2.0进行。

张宏江说,第一个问题是这里有一条曲线。

在它达到奇点之前,人们无法看到它,也无法判断它。

对于人工智能2.0的问题,他认为人工智能2.0不一定是由人类驱动的。

人工智能强大的标志是能否推理问题。

未来人类可能不需要等到对人脑有了很好的了解才去做人工智能,或者说2.0。

最后,张宏江总结道:我们在人工智能领域,当我们看到人工智能作为一种现象的快速进步和突破时,我们应该更加关注它的后端,不仅仅是算法本身的快速进步,而是更重要的是,对这个算法的支持大数据和云计算正在突飞猛进,所以我们看到的未来是前端的一系列智能设备,它的大脑实际上在云端。

以下为张宏江讲话实录。

今天我想讲的是我从产业角度对人工智能的看法,以及为什么人工智能这几年发展得这么快。

最终我将其归功于大数据的进步和云计算的发展。

我们这里的大多数人都非常清楚。

相信有些人可能在今年3月的AlphaGo和李世石身上第一次注意到了人工智能的精彩。

游戏的第一局,我和一些正在做研究的朋友一起玩。

打赌之后,谁赢谁输。

最后,我很幸运地押注在机器人上,所以我最终在AlphaGo上赢了很多钱。

我们已经看到了人工智能50多年的历史。

我们看到The Buzz击败俄罗斯高手后没有任何进展。

突然有一天我们看到AlphaGo以4比1的比分击败了世界上最好的高手。

大家可能会说算法取得了很大的进步,但我认为更重要的是大数据的进步,超级计算和云计算。

我今天不想讨论 AlphaGo 使用什么算法。

我想分享的是其背后的数据以及其背后的高性能计算资源。

在比赛之前,它已经获得了人类6到9级棋手的比赛数据。

训练量已经相当大了,它可以毫无感情地与自己下棋,并且获得了数万个落点数据,这对于人类棋手来说是很难做到的。

实际下棋时,系统本身所需的计算资源,包括多个CPU和多个GPU,消耗的能量是人类的许多倍。

这是在阿尔法狗和人类之间的比赛之前。

人们对阿尔法狗的评价,最高的设定,它的等级已经达到了这样的数字,但是如果我们看看人类的高手,当时给它的数字是,李世石与之前相比,你会认为高手或许还是会赢,但让人没想到的是,机器人在这个过程中学得这么快。

人工智能的进步很大程度上得益于计算的进步。

如果看近几年互联网的快速发展,全球产生和消费的数据每年都会增长10倍,年增长率达到40%。

当互联网突飞猛进的发展,特别是移动设备的快速发展时,我们看到照片的数据增长得如此之快。

前面用的是美国一些知名网站。

不幸的是,我无法获取大部分国内网站的数据。

可以看到,每天上传分享的图片数量已经超过10亿张。

我从2019年开始关注小米手机的数据,到今年年初,它的日上传图片数据已经破亿。

前段时间,马化腾提到,今天,微信朋友圈每天交换的图片数量是10亿张。

人们可能不太关心10亿这个数字,但20年前,中国每年的电影消费量是40亿,是历史最高的一年。

拍了40亿张照片,今天是微信四天的交流量。

这是一个简单的量变带来的质变,尤其是我们在做神经网络的时候遇到的第一个问题,我们得到了非常好的解决方案。

我们再来看另外一个具体情况,因为这个数据是我自己从系统里取出来的。

简单的把这些数据做成一个序列图,这样下次再往下看的时候,整个照片就不会一开始就摇下来了。

这需要2.6G的CPU和T的存储空间。

如果小米用户在小米云上保存的照片超过5亿张,则需要1万个核心和P存储空间。

然而,今天中国的库存照片,即年度数据,将需要1亿张照片。

存储空间和计算量如此巨大。

正是因为有如此大量的图片,我们以前认为不可能的神经网络训练任务今天可以相对轻松地完成。

右图是《纽约时报》2016年报道的一个作品,是如何让计算机自动识别猫的脸。

它使用的数据和我们之前在AR中讲的基本一样,是一种野蛮的力量。

0 个处理器制作了 10,000 张照片。

今天的数字是一年的数字。

今天的数字对我们来说已经是小菜一碟了。

如今手机上的应用,大家使用手机的时候,手机可以对人脸进行一系列的处理。

一开始,人们总是想在手机上做一些很酷的事情,比如通过照片猜测年龄。

这就是小儿科,我们20年前就有这个想法,今天终于在手机上实现了。

以前我们拍的照片太多,只能按照时间和地点来查找。

今天用人脸检测,我打开人脸,这是我的照片,所有跟我有通讯录的人的照片都在。

出来的时候,我点开雷军的照片,所有与雷军相关的照片都出来了。

我们再看另一种人多的情况。

当他第一次见到一些人时,我以前没有标记过这些人,他们也没有出现在我的朋友圈中。

它会询问您有关这些人的信息。

到底是谁啊,整个系统,今天不仅仅是小米手机,只要这些东西有云功能,只要背后有支持云的手机,今天做到这一点并不难。

什么样的力量,什么样的进步,让今天做这种事情显得那么容易,或者说人们觉得手机的功能那么强大,但是我想告诉大家,这不是手机能做到的,这就是手机之后的情况。

端上的云端正在做,因为手机拍照的时候,在云端进行处理,很快就返回结果。

这是我们20多年来的梦想。

我有一个数字可以证明这一点。

这是2008年惠普的一项实验,并申请了专利。

工作于当年完成,最终专利于当年获得批准。

我们来看两张图片。

第一张图是人脸识别对比图。

第二张图是我们20年前的架构。

也就是说,这是一个分布式架构。

从客户端获取数据,然后传输到后端。

一系列流程在端系统完成,结果推送到前端。

20年后的今天,这个东西终于可以在手机上实现了,或者更重要的是,终于可以在云端和终端上实现了。

手机和云作为数据采集终端,作为整个计算载体和整个数据载体,终于实现了我们20年前的梦想。

不幸的是,因为这个专利是2010年申请的,一天后就会失效,所以我没办法帮他们索要专利费。

我刚才说了这么多,从学术角度来说,我认为人工智能这20年的发展,特别是人脸识别领域的进步,其实可以归功于一个数据库的扩展。

20世纪90年代,我们90年代初做鬼脸的时候,学术时代用的数据库都是几百人。

因为数据量很小,可以说它的识别率是95%到99%,但即便如此,机器人的识别能力仍然比人类的识别能力低很多,而且光线要求非常高,而且图像必须是正面。

当我们看到随着数据的增加,再过十年,我们会看到这些照片已经从几千人,到近万张照片。

这时,识别能力得到了进一步的提升,对表情、光线的识别等的要求就没有那么严格了。

进入新年后,数据量爆发式增长。

这时候互联网开始流行,而且量如此之大。

到了LFW的数据积累时,已经和人几乎一样了,这进一步将识别率提高到了95%以上。

到时候业界加入进来,当学术界真正开始突破的时候,它的训练数据就找到了更多的训练。

在真正的人脸识别时代,业内人士认为这个问题可以变得现实。

当行业开始进入的时候,此时的数据量和学术界的数据量不是一个数量级的。

Facebook和Deepface已经达到了4.4M一张图片,一个人,每人一张图片。

到Google和FaceNet的时候,已经有2亿张图片,1万人,参数已经超过0万个参数。

如果我们看一下这部作品,这里也非常明显。

当我们的训练量开始增加时,同一个模型的准确率的提高是非常相关的。

当然,当数据量比较小时,增加一个数量级时,提升会比较小。

只需要增加一个数量级,就能实现小数点后一位数的增加。

当我们研究算法时,这同样适用。

当算法变得越来越准确时,您所需的计算能力也迅速增加。

我们还可以看到,当计算复杂度超过十亿浮点数时,我们可以看到检测精度的提高。

我们来看看真实的行业,靠人脸识别谋生的公司,以及近年来的进展。

我举了两个例子,商汤科技和依图科技。

从他们那里获得的数据基本上是关于中国人口的。

数据,一万多张标准照片加上一亿张其他照片,人们使用的深度网络已经超过了30层,训练了20个NVIDIA训练块。

如今的准确度已经远远超过了人类。

如果你今天想做坏事,只要留一张照片,基本上是逃不掉的。

这是当今商业解决方案已达到的精度水平。

我还是想强调一下,如果没有那么多照片,尤其是在中国的环境下,当所有的网上行为都连接在一起的时候,你会发现判断的准确性会大大提高。

我们再看一下。

当我们的数据、识别精度和算法变得如此庞大,从四年前的80%网络到今年的层识别时,我特地拿到了这个数据。

如今,神经元的数量已经达到一万个,最后下降到一万个。

当我们拥有大数的野蛮力量时,我们会给人工智能带来什么?所以我说数据是我们进步的核心,我们有句话说,数据永远不会太多,也永远不会足够。

特斯拉声称,每天有 17 万辆汽车在路上行驶,以帮助其收集数据。

但当强光照射时,就会造成误判。

所以当我们谈论大数据时,我们总是谈论要解决的问题。

只有当你比较简单的时候,少量的数据就可以满足你的要求。

当您使用复杂模型时,数据量必须远远超出您的训练需求。

数据越多,覆盖精度越高。

对模型的依赖将会减少。

在大数据方面,微软走得很早。

我们非常尊敬的 Michael Wooldridge 先生十年前就提出了可学习范式的概念。

从牛顿力学到几百年前,我们都使用理论方法。

解释一下,今天我们用数据来驱动它。

这本书出版于2011年,我确实认为,在我们进入第四范式的今天,数据在我们日常工作和研究中的作用是以前完全无法比拟的。

大数据包括高质量数据的获取和分析,其在应用中的整个分析已经越来越成为企业的标准。

如果你是一家大公司,你没有大数据分析,或者没有办法获取大数据。

数据,或者说如果你不把这些大数据转化为专家,你实际上很难在你的行业生存。

当然,这一切都必须有云的支持。

没有云,我们就谈不上大数据,也谈不上大数据的获取、处理和运营。

这就是为什么我们今天看到一系列云公司,尤其是大型云公司,越来越强调数据存储和处理。

金山软件很早就进入了云存储和云数据分析领域。

无论是原始数据、图片还是视频,每天都会处理大量的数据。

然后将生成器大量存储在云端,然后由云端进行处理和分析。

这就需要大量的资源才能真正消费掉我刚才提到的数据,比如人脸识别,这是我们20多年前就梦想解决的问题。

我们今天看到的大多数智能平台,无论是消费类智能平台还是工业智能设备,智能程度都非常低。

他们的情报隐藏在后端云中。

大家都知道,人工智能现象在这几个月的网红视频直播中也出现了。

这些公司之所以能一夜崛起,是因为其背后的支撑技术,是多年来从事采集、编解码的。

一切都已经由视频云计算公司提供了,所以你想做网红直播,只需要找一个网红,搭建一个网站,写一个APP,后端的一切事情将由云提供。

同样的医疗,今天中国的医疗问题那么多,精准医疗、精准康复谈不上。

只有基于大数据云平台将这些系列连接起来,才能实现我们所说的精准医疗、精准康复、社区医疗。

今天也在这座城市,我们有大华公司的代表。

众所周知,里约奥运会上,大部分摄像机都是来自大华,每天收集的数据非常多。

这是智慧城市的核心。

一部分是当你把这些数据运用起来、利用起来的时候,你才能真正感受到这些数据的价值。

同样,对于游戏来说更是如此。

手游这么好玩,背后都是智能分析,所以什么时候推出游戏、什么时候推出新服务等等,这一切都是由背后的数据驱动的。

说了这么多,但是大家还是有疑问,那就是云计算是否还在云端。

我告诉大家,今天云计算已经真正实现了。

这是 Gaslnes 的年度技术成熟度分析。

同样,市场对云计算公司的看法也非常非常乐观。

如果我们回顾过去30年互联网上增长最快的公司,我们用一个数据来衡量哪些公司在最快的时间内达到了1亿美元。

显然互联网公司的速度很快。

一个叫 Facebook,另一个叫 Google。

十年内销售额达到1亿美元的2B公司只有一家,那就是亚马逊云。

当2B业务追上2C业务的时候,你就知道人们的需求有多大。

当然很大,具体细节我就不说了。

事实上,市场的反应非常明确。

当你在云上快速投资、在云中快速增长股票时,你可以看到市场给出了最好的回报。

同样,对于我们这些在中国从事人工智能工作的人来说,这个数字是非常令人鼓舞的。

如今,中国的互联网产值只有美国的百分之几。

我们思考的是未来几年云计算行业的空间和增长。

速度这么快,这也是金山软件这几年投入这么多资源的原因,让我们成为中国的云计算服务商,成为国内游戏云、视频云、智能硬件等领域的领先企业。

市场的增长速度实际上比我们想象的要快。

我的结论是,当我们从事人工智能工作时,当我们看到人工智能作为一种现象的快速进步和突破时,我们应该更加关注它的后端,不仅仅是算法本身的快速进步,更重要的是,对这个算法的支持随着大数据和云计算的快速推进,所以我们看到的未来是前端的一系列智能设备,它的大脑实际上是在云端。

AIR 004丨金山CEO张宏江:智能、大数据、云

AIR 004丨金山CEO张宏江:智能、大数据、云

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 米业消费升级,“龙米之家”完成数千万元A1轮融资

    米业消费升级,“龙米之家”完成数千万元A1轮融资

    投资行业消息,据创业网消息,新消费品牌“龙米之家”完成数千万元A1轮融资年底A1轮融资。 本轮融资大部分资金将用于供应链体系建设,其次是品牌营销、资源整合、客户开发、信息化建设和团队建设。 此前,龙米家族曾获得德商资本、深圳联合创投、汇和裕廊创投、王老吉前董事长

    06-18

  • 云智物联完成数千万元Pre-A轮融资, “共享厕纸”是共享经济的正确打开方式吗?

    云智物联完成数千万元Pre-A轮融资, “共享厕纸”是共享经济的正确打开方式吗?

    继共享单车大战、共享充电宝大战之后,共享纸巾的战场也拉开了帷幕。    据投资界5月21日消息,以免费厕纸变现精准流量的云智物联网宣布,近日获得数千万元Pre-A轮融资,由九洲星投资领投本次投资及天使轮投资方易云投资及某股东跟投。 本轮融资将用于市场开拓、软件以及3.

    06-18

  • 最便宜的纯电动保时捷来了,网友:不是买不起,小米性价比更高

    最便宜的纯电动保时捷来了,网友:不是买不起,小米性价比更高

    第一要务:拉动销量。 销量最大的保时捷SUV将是电动化的。 1月25日,保时捷发布了第二款纯电动车型,也是首款SUV车型——全新纯电动Macan。 此次共发布了两款车型,分别是Macan 4和Macan Turbo。 中国市场已经开始预售。 至于正式上线时间,我们还需要等待。 官方计划在北京车

    06-18

  • 博宇歌乐完成1000万美元A轮融资,经纬创投独家领投

    博宇歌乐完成1000万美元A轮融资,经纬创投独家领投

    投资社区(ID:pedaily)1月21日消息,互联网科技公司博宇歌乐(BurningGalaxy)宣布完成千万融资A轮融资,本轮融资由经纬创投独家领投。 完成本轮融资后,计划于今年6月在北美地区启动服务。 经纬创投合伙人合伙人王华东表示:我们看到了“用户就是创作者”这一主题在全球内

    06-18

  • 赛默飞在SEMICON CHINA 2019上发布最新半导体解决方案

    赛默飞在SEMICON CHINA 2019上发布最新半导体解决方案

    致力于提高工厂和分析实验室效率,推动中国半导体行业快速发展2019年3月21日,上海 - 全球科学服务领导者赛默飞赛默飞科技(以下简称:赛默飞)亮相上海SEMICON CHINA展会。 现场发布并展示了其最新一代产品和集成半导体解决方案。 新产品致力于提高工厂和分析实验室的效率,

    06-06

  • 外媒:英特尔溢价60%收购Tower Semiconductor,或许是为了避免中国企业介入

    外媒:英特尔溢价60%收购Tower Semiconductor,或许是为了避免中国企业介入

    当地时间2月15日,据外媒semiwiki报道,英特尔宣布将收购以色列Tower Semiconductor 54 亿美元。 )。 这相当于每股 53 美元。 但该公司最后一笔交易价格为每股33美元,溢价高达60%。 据报道,塔半导体获得了更多中国业务和军工业务。 这些都是支持英特尔战略方向所需要的。

    06-08

  • 中冶已于本月初向香港联交所申请10月先A后H上市

    中冶已于本月初向香港联交所申请10月先A后H上市

    新闻人士透露,内地综合资源公司中国冶金科工集团(以下简称中冶集团)已于本月初向香港联交所提交A1申请上市申请,正式启动上市程序,拟募集资金逾亿元。 公司在中国和香港市场将维持先A后H的募集资金模式,但初步计划是H股上市日期仅比A股晚几天。   如果上市顺利,中冶集

    06-17

  • 三盟科技完成过亿元B1轮融资

    三盟科技完成过亿元B1轮融资

    据投资界9月4日消息,近日,三盟科技股份有限公司完成过亿元B1轮融资。 本轮融资由SBI学大基金、兆恒投资、基因资本及个人投资者共同参与投资,多鲸资本担任财务顾问本轮融资。 本轮融资将主要用于高等教育校园“教育大脑”系列的产品迭代和业务拓展、通识教育“城市教育大脑

    06-18

  • 瑞明新药完成A+轮融资,汇美资本领投,

    瑞明新药完成A+轮融资,汇美资本领投,

    投资圈(ID:pedaily)据6月15日消息,国内治疗性小分子眼科新药研发平台苏州瑞明新药研发有限公司(以下简称“瑞明新药”)明新药研发有限公司宣布完成近亿元A+轮融资,由汇美资本领投,现有股东泰煜投资、药明药业跟投。 本次融资是公司继去年A轮之后一年内完成的又一新一轮

    06-18

  • 海外呼叫中心服务:概念、功能、挑战、解决方案与前景

    海外呼叫中心服务:概念、功能、挑战、解决方案与前景

    .wp-block-column h3{margin-left:0} 一、引言 随着全球化的加速和海外市场的拓展,海外呼叫中心服务成为企业海外业务发展的重要支撑。 海外呼叫中心不仅提供语言翻译、时区适配等服务,还承担海外客户关怀、市场调研、业务拓展等任务。 本文将阐述海外呼叫中心服务的概念、功

    06-17

  • 深圳科技获数千万美元B轮融资,源码资本、启明创投领投,

    深圳科技获数千万美元B轮融资,源码资本、启明创投领投,

    投资圈(ID:pedaily)据1月17日消息,深圳科技宣布完成数千万美元B轮融资。 本轮融资由源码资本、启明创投联合领投,现有股东高瓴创投、经纬创投跟投。 奇迹资本担任本轮融资独家FA。 本轮融资将用于不断吸引行业顶尖人才,从而深化微观工业设计平台的建设以及相关技术在药物

    06-18

  • 徐州在投资界藏着一批独角兽

    徐州在投资界藏着一批独角兽

    城市招牌,我们来到了苏西北城市徐州。 徐州地处鲁、鲁、豫、皖四省交界处,东邻连云港,南接宿迁,西接苏州、淮北,北接山东多个城市。 京杭大运河贯穿其中。 徐州素有“五省纵贯”之称。 此外,徐州还是“中国工程机械之都”和国际新能源基地。 经过多年发展,徐州已形成“

    06-18