华天科技与合作伙伴成功研发硅基扇出封装技术,良率超过98%
06-06
作为手机不可或缺的功能,手机拍照一直是用户判断一款终端好坏的直接标准之一。
受限于物理极限和摩尔定律,相机和传感器不太可能实现“质”的飞跃。
未来几年,手机摄影的突破点将是AI技术与零部件的深度融合。
近日,商汤科技与艾瑞咨询联合发布的《年中国人工智能手机行业研究报告》指出,2018年及之前,手机行业正处于功能推广阶段,从开始的拨打、接听电话,到搭载拍照、拍照等复合功能。
听音乐、上网。
2004年至2018年,市场进入性能驱动阶段,配置成为商家竞争的方向。
多年后,市场已进入情报驱动阶段。
人工智能已经开始推动手机产品的迭代,硬件技术的升级需要软件技术的优化和凸显。
人工智能手机=AI芯片+AI功能,即“满足AI算力需求、装载深度学习AI功能的手机芯片”。
AI芯片是指内置独立的神经网络计算单元,通过CPU、GPU、DSP等通用计算单元联动赋能。
AI功能包括人脸解锁、AI摄影、智能相册、AI智能助手等。
报告显示,巨头厂商在多方面推动AI手机落地,扮演了角色领军者的角色。
2018年,我国4G普及率达到70%,手机市场从3G升级到4G的结构性红利逐渐丧失。
某些硬件升级的边际成本与收益不成正比。
在此情况下,预计到2020年,搭载AI功能的智能手机出货量占比将从不足10%提升至80%,年销量将超过13亿部。
AI手机将是未来行业的产品方向。
虽然这几年,AI人工智能手机噱头十足,但也不乏各种炒作和无理吹嘘。
但移动摄影的巨大进步主要体现在软件和硅层,而不是传感器和镜头等硬件。
AI人工智能可以更好地理解图像中呈现的内容。
预计未来几年,关于手机摄影的常识将从硬件思维转向AI思维。
手机厂商的人工智能技术水平将成为判断手机拍照功能好坏的主要标准,而且这一趋势没有放缓的迹象。
2018年,谷歌推出了一款人工智能技术与摄影技术融合后清晰显示照片的APP。
在此之前,谷歌一直在尝试通过机器学习技术对照片进行分类。
谷歌的照片APP直接向消费??者提供人工智能服务,这对大多数人来说是不可想象的。
“突然之间,用户可以从一个包含数千张图像的杂乱库变成一个可搜索的库。
” “突然之间,谷歌就知道你的猫长什么样了。
”据雷锋网报道,2019年,谷歌收购了多伦多大学神经网络初创公司DNN Research,以推广谷歌的语音和基于图像的搜索功能。
该公司通过训练人类标记的数据来训练深度学习网络,这一过程称为监督学习。
具体来说,该网络经过数百万张图像的训练,因此可以通过像素级视觉线索帮助图像识别和分类。
随着时间的推移,算法会变得越来越准确。
例如,大熊猫包括正确识别熊猫的动物类别、黑色皮毛与白色皮毛的比例以及与荷兰牛皮毛的区别的能力。
通过进一步的训练,可以理解更抽象的词汇。
例如“动物”、“早餐”等对于人类来说比较简单,但是对于机器来说,它们是没有视觉输出的单词。
训练上述模型需要大量的时间和组织能力。
数据中心建成后,将能够以低功耗、便捷的方式在设备上运行。
现在前期的繁重工作已经完成,只要将照片上传到云端,谷歌就可以利用模型对整个图片库进行分类和标注。
谷歌照片推出大约一年后,苹果推出了基于神经网络的照片搜索功能(类似于谷歌)。
不过,鉴于苹果对用户隐私法规的承诺,苹果的分类功能实际上是在每个设备中单独执行的。
设置后,在后台执行,不发送数据,最多需要一到两天。
虽然和智能照片管理是同一个东西,但人工智能和机器学习对于照片拍摄来说无疑具有重要的意义。
相机和传感器可以“比大还大”,但它们扮演什么角色呢?相机和传感器已达到其物理极限。
如今,在某些情况下手机比传统相机拍出更好的照片并不罕见。
这背后的根本原因是传统相机在芯片维度无法与手机竞争。
手机芯片系统包括CPU、图像信号处理器以及越来越多的神经处理单元NPU。
硬件的变化导致了计算摄影时代的到来。
从广义上讲,这个概念涵盖了从人像模式下的“假景深”到算法和所有形式的计算的一切,帮助助手拍摄了令人难以置信的手机照片。
并非所有计算摄影都包含人工智能,但它肯定是重要的一部分。
以前苹果手机都是基于此来驱动双摄像头的人像模式。
一个 iPhone 摄像头的图像信号处理器使用机器学习来区分人物,另一个摄像头创建深度图来隔离主体并模糊背景。
这项技能早在 2000 年就已出现,因此通过机器学习识别人员并不是什么新鲜事。
照片组织软件已经做到了这一点。
智能手机摄影的突破在于实时处理速度。
不过,谷歌是这一领域的领导者,第三代 Pixel 所展示的结果令人信服。
HDR+ 是一种默认摄影模型,它使用复杂的算法将多个曝光不足的帧合并为一个帧。
正如谷歌计算摄影主管 Marc Levoy 所说,“随着时间的推移,机器学习只会变得更好。
就像 Google Photos 一样,谷歌已经在一个巨大的标记照片数据库上训练了它的人工智能。
”进一步帮助相机的曝光,比如Pixel 2 产生了令人印象深刻的照片质量基准。
”几个月前,谷歌推出了 Night Sight 功能,该功能利用机器学习技术来准确捕捉长时间曝光。
预测白平衡和颜色。
其中Pixel 3的效果最好,可能是因为算法是用最新的硬件迭代的。
这套算法适用于所有Google Pixel系列,甚至是缺乏光学防抖的工程机。
这也从侧面说明,对于手机摄影来说,相机软件比硬件更重要。
总之,在人工智能的“管理”下,硬件有更大的提升空间。
据雷锋网了解,华为nova 4和荣耀View 20首次采用索尼IMX图像传感器,像素达到10000,这意味着现阶段分辨率的最高水平。
即便如此,像素仍然需要填充在许多极其微小的单元中,这对图像质量产生了不确定的影响。
荣耀的“AI超清晰”模式擅长最大限度地利用分辨率,解扰传感器不寻常的滤色镜,并释放额外的细节。
用户可以放大图片,“海报”质量的照片就会出现。
在一段时间内,图像信号处理器一直非常重要。
随着计算摄影技术的进步,NPU将发挥重要作用。
虽然苹果的A11仿生芯片最先到达消费者手中,但华为却是第一家宣布在自家的麒麟芯片上使用人工智能芯片的公司。
全球最大的Android处理器供应商高通并未将机器学习作为战略重点。
谷歌开发了自己的芯片 Pixel Visual Core,以帮助人工智能相关的图像处理。
苹果最新的 A12 仿生芯片采用八核神经引擎,可在 Core ML 中运行任务,直接连接到图像处理器,速度比 A11 快九倍。
它可以更好地聚焦并产生更真实的景深。

因此,芯片对于机器学习的效率和性能至关重要。
值得注意的是,谷歌的算法是在大型计算机上训练的。
大型计算机拥有先进的GPU和NVIDIA深度学习Tensor Core(张量计算核心),大部分工作都可以“提前”完成。
一旦机器学习的计算能力转移到移动设备上,可以预见它将在很长一段时间内成为前沿研究。
即使在计算摄影的早期阶段,神经引擎也可以减轻手机拍照的处理负担,并且随着时间的推移运行得越来越快。
拍照是任何手机最基本的功能。
Face ID、人脸识别解锁、AR视频、AI人像、风景美化、相册智能分类、智能场景识别……近两年已经深入到普通人的日常生活中。
《年中国人工智能手机行业研究报告》显示,语音处理、人脸解锁、智能补光、美颜、图像识别已成为今年中国AI智能手机用户最常使用的TOP5功能。
人脸解锁、语音录音、随身翻译、智能补光、AI双/三摄、背景虚化成为用户认为最有价值的TOP5功能。
雷锋网认为,指数级增长遇到物理极限的“天敌”,无休无止的增长逐渐放缓。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-17
06-18
06-18
最新文章
3月,腾讯《王者荣耀》在全球App Store和Google Play吸引了2.57亿美元,同比增长63%
生鲜传奇宣布完成数亿元B+轮融资
裁员20%?红杉中国回应:胡说,员工总数不降反升
第二次影视创新“闯”短剧世界:看、留、跳都是钱
ASML:从飞利浦弃儿到光刻之王
宁康瑞珠获数千万元A轮融资 横琴金投、翰颐资本投资
智能金融服务生态平台科客完成A+轮融资
拼多多九鼎:信息披露无懈可击,竞争对手才是“浇水”的