【正月初四、初三开泰三羊】生成式AI释放创造力魔力,2024年新年开启智能新时代!
06-18
据雷锋网报道,11月19日上午,世界人工智能融合发展大会在山东济南正式召开。
会议由工业和信息化部、中国工程院、山东省人民政府指导,山东省工业和信息化厅、省教育厅、省教育厅承办。
科技部、省财政厅、济南市人民政府、新一代人工智能产业技术创新战略联盟共同主办。
本次大会上,中国工程院院士、新一代人工智能产业技术创新战略联盟理事长高文;中国工程院院士、浪潮集团院士首席科学家·王恩东;英国皇家工程院院士、昆云科技院士首席科学家·陆永青;富士康工业互联网李军旗董事长等嘉宾出席并作主题报告。
高文报告的主题是《智能交通与数字视网膜》。
以下内容由雷锋网整理、编辑,不改变原意: 尊敬的各位专家、同事、朋友们,大家好!智能交通之所以被称为“智能”,是因为它可以通过一些技术手段提高效率;例如,它可以知道哪条路的汽车较多,哪条路的汽车较少。
尽管以前的信号控制系统已经做了很多类似的工作,但大多数系统通过地面线圈或通过摄像机收集的信息提供输入。
今天我想跟大家分享的就是结合最现代的传感器和计算系统,做好智慧交通。
首先,我们来了解一下什么是数字视网膜。
事实上,数字视网膜笔记本现在已经形成了一个规模化的体系。
这个系统如何能够很好地协调视频中“看到”的内容,需要解决三个问题:一是为什么,一是怎么做,二是具体概念是什么?整体来看,无论是数字视网膜、图像处理还是视频处理,都经历了漫长的进化之路。
例如,视频处理技术刚出现时是模拟摄像机的,大概是在19世纪中叶。
后来,从伦敦开始,人们慢慢地使用这些图像和它们所传达的内容;直到19世纪中叶计算机出现后,人们开始将模拟图像转为数字图像进行处理和传输。
如今,图像处理不断发展,从卫星图像到医学图像,甚至覆盖了我们生活的方方面面。
过去,人们在这方面没有很强的处理能力,但现在,摄像头和传感器的发展越来越好,云计算也出现了。
以前的摄像头现在变成了摄像头网络,由成千上万个摄像头连接起来;原本简单的云存储也成为了复杂的城市大脑。
一个城市有一个主仓储中心和多个分仓储中心。
智能交通的决策分析在主中心进行,数据从末端各个摄像头传输到分存储中心,然后汇聚到主中心。
那么,这些数据到底是怎么来的呢?之前的模型是摄像头用编码器将拍摄到的内容压缩并发回,到达中央中心后再解压。
通过手动系统提取有用信息并进行分析和识别。
随着人工智能技术越来越成熟,上述的手工工作都交给了深度神经网络,只要有足够的计算能力即可。
然而,这样的系统真的能提高效率吗?如果效率不好,原因是什么?刚才说了,摄像头拍完照片后,需要进行压缩,然后发送到中央中心进行解码,然后进行特征提取、分析、识别。
事实上,这个过程需要一定的时间,而且很难达到实时的效果。
为了解决这个问题,人们不断对系统进行升级,添加许多专门的智能摄像头,直接识别一些特征,而不需要经过编码过程,从而节省时间。
这个解决方案真的有好处吗?其实并不是。
因为,这样做确实可以解决一些小问题,但是却带来了更多的大问题。
如今的摄像头网络非常庞大,因此它收集的数据也非常庞大。
然而,大数据并不意味着大数据。
这些摄像头捕捉到的85%-90%是监控视频数据,很难帮助改善整个城市的管理和规划;而且最多只能保存三个月,最多可以保存两个月。
它在一周内被覆盖或废弃。
如此大的数据量却只具有超低的价值密度。
我们应该想办法对其进行转换,使其更有价值。
问题实际上出在架构上。
按照原来的架构,几乎99%的摄像头都只是用来拍摄然后对内容进行编码。
即使它们传输的数据稍后被使用,相机的贡献也是微乎其微的。
因此,我们需要找到方法让相机做更多的工作,但不能将其升级为简单的智能相机来识别人脸或车牌(原因如上所述)。
真正有用的方法是让摄像头提取有用的数据,传输到云端,然后在云端处理成有价值的大数据,长期保存。
这是受到生物世界的启发。
无论是人类还是动物,我们都有眼睛,而且它们的效率很高。
眼睛通过视网膜获取光信号。
视网膜中有两种关键细胞,感光细胞和视锥细胞。
这两个细胞总共有1.26亿个,我们平时看到的都是通过这些细胞。
传输到大脑。
然而,信息向后传输时,会经过好几层,信息在每一层都会减少,直到到达大脑神经的连接点。
举两个例子,正常孩子的学习过程实际上是对全连接神经网络的强化和剪裁。
有的连接越来越粗,有的连接慢慢缩小。
最终,他可以变得高效。
区分事物。
相反,自闭症儿童的终末神经与大脑末梢神经一样粗,但完全连接,无需剪断。
他很难集中注意力。
这也说明了信息还原的重要性,但目前我们的相机不具备信息还原的功能,相当于一个“自闭系统”。
因此,我们的系统必须像人类的视觉系统一样,将信息进行缩减,然后向上发送。
为此,去年我和北京大学的同志、阿里巴巴的同志在《中国科学》上发表了一篇文章,题为《数字视网膜智慧城市系统演进的关键环节》。
如果使用所谓的数字视网膜,这个问题就可以解决。
数字视网膜有八个主要特征。
我总结了三个最本质的特征:第一个特征叫做全球统一的时空ID。
每个摄像头必须有一个全球统一的时空ID,地理位置全球统一;每个摄像头只要发回信息,就会立即知道在全球统一时间发生了什么以及物理位置在哪里。
第二个特点是视网膜本身必须具备高效视频编码、高效特征编码和联合优化的能力。
高效视频编码的标准有很多,例如AVS标准、MPEG4等;目前的特征编码标准有MPEG、CDVS标准、CDVA标准;如果你想在一个码流中同时监控视频编码和特征编码,你需要方法让它们联合优化。
第三个本质特征是模型可更新、注意力可调整、软件可定义。
这也是三个不同的要求。
我们现在都在使用神经网络模型,随着时间的推移可能会出现新的算法。
因此,数字视网膜模型必须是可更新的;换句话说,每个相机上的算法都可以升级。
注意它是可调的,主要是可以在后台控制。
同一张图片中事物的优先级在每个地方都是不同的。
我们可以赋予它感兴趣区域的功能,让它能够关注一些特别重要的区域,并保留这个区域的信息。
软件可定义性可以通过软件升级来实现。

这种新的数字视网膜实际上具有三个流,而不像传统相机只有一个流,即视频压缩流或识别结果流。
数字视网膜的三流包括视频编码流、特征编码流、模型编码流。
当然,这三个流是有分工的。
有的可以在前端实时控制和调整,有的可以通过云端反馈来调整和控制。
这是数字视网膜。
事实上,数字视网膜主要是采用脑眼一体化的方式,通过数字视网膜的处理,将未来终端的信息发送到云端。
现在,我们在深圳专门做数字交通,并为此进行大规模的培训。
其中,有一些开源的东西,包括建立开源生态系统,以及一些潜在的能源技术。
其中,视频编码标准是一项重要的势能技术。
现在,联盟也在以刚才提到的标准设备为基础,制定一些大型的应用标准,并且正在逐步推进。
第一个数字视网膜芯片已经在路上,很快就会发布。
这个芯片只有一枚硬币那么小,但是它包含了我刚才提到的所有三个基本特征和八个功能。
未来,这种芯片可能会直接集成到各种智能交通系统中,并支持数字视网膜的应用。
雷锋网年度评选——寻找19大行业的最佳人工智能实施实践。
2017年创办的“人工智能最佳掘金案例年度榜”是业界首个人工智能商业案例评选活动。
雷锋网从商业角度出发,寻找人工智能在各行业的最佳实施实践。
第三次评选已正式启动。
关注微信公众号“雷锋网”,回复关键词“名单”即可参与报名。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-18
06-18
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态