首页 > 科技启迪 > 内容

未来几年谁能拯救手机的拍照功能?

发布于:2024-06-17 编辑:匿名 来源:网络

作为手机不可或缺的功能,手机拍照一直是用户判断一款终端好坏的直接标准之一。

受限于物理极限和摩尔定律,相机和传感器不太可能实现“质”的飞跃。

未来几年,手机摄影的突破点将是AI技术与零部件的深度融合。

近日,商汤科技与艾瑞咨询联合发布的《年中国人工智能手机行业研究报告》指出,2018年及之前,手机行业正处于功能推广阶段,从开始的拨打、接听电话,到搭载拍照、拍照等复合功能。

听音乐、上网。

2004年至2018年,市场进入性能驱动阶段,配置成为商家竞争的方向。

多年后,市场已进入情报驱动阶段。

人工智能已经开始推动手机产品的迭代,硬件技术的升级需要软件技术的优化和凸显。

人工智能手机=AI芯片+AI功能,即“满足AI算力需求、装载深度学习AI功能的手机芯片”。

AI芯片是指内置独立的神经网络计算单元,通过CPU、GPU、DSP等通用计算单元联动赋能。

AI功能包括人脸解锁、AI摄影、智能相册、AI智能助手等。

报告显示,巨头厂商在多方面推动AI手机落地,扮演了角色领军者的角色。

2018年,我国4G普及率达到70%,手机市场从3G升级到4G的结构性红利逐渐丧失。

某些硬件升级的边际成本与收益不成正比。

在此情况下,预计到2020年,搭载AI功能的智能手机出货量占比将从不足10%提升至80%,年销量将超过13亿部。

AI手机将是未来行业的产品方向。

虽然这几年,AI人工智能手机噱头十足,但也不乏各种炒作和无理吹嘘。

但移动摄影的巨大进步主要体现在软件和硅层,而不是传感器和镜头等硬件。

AI人工智能可以更好地理解图像中呈现的内容。

预计未来几年,关于手机摄影的常识将从硬件思维转向AI思维。

手机厂商的人工智能技术水平将成为判断手机拍照功能好坏的主要标准,而且这一趋势没有放缓的迹象。

2018年,谷歌推出了一款人工智能技术与摄影技术融合后清晰显示照片的APP。

在此之前,谷歌一直在尝试通过机器学习技术对照片进行分类。

谷歌的照片APP直接向消费??者提供人工智能服务,这对大多数人来说是不可想象的。

“突然之间,用户可以从一个包含数千张图像的杂乱库变成一个可搜索的库。

” “突然之间,谷歌就知道你的猫长什么样了。

”据雷锋网报道,2019年,谷歌收购了多伦多大学神经网络初创公司DNN Research,以推广谷歌的语音和基于图像的搜索功能。

该公司通过训练人类标记的数据来训练深度学习网络,这一过程称为监督学习。

具体来说,该网络经过数百万张图像的训练,因此可以通过像素级视觉线索帮助图像识别和分类。

随着时间的推移,算法会变得越来越准确。

例如,大熊猫包括正确识别熊猫的动物类别、黑色皮毛与白色皮毛的比例以及与荷兰牛皮毛的区别的能力。

通过进一步的训练,可以理解更抽象的词汇。

例如“动物”、“早餐”等对于人类来说比较简单,但是对于机器来说,它们是没有视觉输出的单词。

训练上述模型需要大量的时间和组织能力。

数据中心建成后,将能够以低功耗、便捷的方式在设备上运行。

现在前期的繁重工作已经完成,只要将照片上传到云端,谷歌就可以利用模型对整个图片库进行分类和标注。

谷歌照片推出大约一年后,苹果推出了基于神经网络的照片搜索功能(类似于谷歌)。

不过,鉴于苹果对用户隐私法规的承诺,苹果的分类功能实际上是在每个设备中单独执行的。

设置后,在后台执行,不发送数据,最多需要一到两天。

虽然和智能照片管理是同一个东西,但人工智能和机器学习对于照片拍摄来说无疑具有重要的意义。

相机和传感器可以“比大还大”,但它们扮演什么角色呢?相机和传感器已达到其物理极限。

如今,在某些情况下手机比传统相机拍出更好的照片并不罕见。

这背后的根本原因是传统相机在芯片维度无法与手机竞争。

手机芯片系统包括CPU、图像信号处理器以及越来越多的神经处理单元NPU。

硬件的变化导致了计算摄影时代的到来。

从广义上讲,这个概念涵盖了从人像模式下的“假景深”到算法和所有形式的计算的一切,帮助助手拍摄了令人难以置信的手机照片。

并非所有计算摄影都包含人工智能,但它肯定是重要的一部分。

以前苹果手机都是基于此来驱动双摄像头的人像模式。

一个 iPhone 摄像头的图像信号处理器使用机器学习来区分人物,另一个摄像头创建深度图来隔离主体并模糊背景。

这项技能早在 2000 年就已出现,因此通过机器学习识别人员并不是什么新鲜事。

照片组织软件已经做到了这一点。

智能手机摄影的突破在于实时处理速度。

不过,谷歌是这一领域的领导者,第三代 Pixel 所展示的结果令人信服。

HDR+ 是一种默认摄影模型,它使用复杂的算法将多个曝光不足的帧合并为一个帧。

正如谷歌计算摄影主管 Marc Levoy 所说,“随着时间的推移,机器学习只会变得更好。

就像 Google Photos 一样,谷歌已经在一个巨大的标记照片数据库上训练了它的人工智能。

”进一步帮助相机的曝光,比如Pixel 2 产生了令人印象深刻的照片质量基准。

”几个月前,谷歌推出了 Night Sight 功能,该功能利用机器学习技术来准确捕捉长时间曝光。

预测白平衡和颜色。

其中Pixel 3的效果最好,可能是因为算法是用最新的硬件迭代的。

这套算法适用于所有Google Pixel系列,甚至是缺乏光学防抖的工程机。

这也从侧面说明,对于手机摄影来说,相机软件比硬件更重要。

总之,在人工智能的“管理”下,硬件有更大的提升空间。

据雷锋网了解,华为nova 4和荣耀View 20首次采用索尼IMX图像传感器,像素达到10000,这意味着现阶段分辨率的最高水平。

即便如此,像素仍然需要填充在许多极其微小的单元中,这对图像质量产生了不确定的影响。

荣耀的“AI超清晰”模式擅长最大限度地利用分辨率,解扰传感器不寻常的滤色镜,并释放额外的细节。

用户可以放大图片,“海报”质量的照片就会出现。

在一段时间内,图像信号处理器一直非常重要。

随着计算摄影技术的进步,NPU将发挥重要作用。

虽然苹果的A11仿生芯片最先到达消费者手中,但华为却是第一家宣布在自家的麒麟芯片上使用人工智能芯片的公司。

全球最大的Android处理器供应商高通并未将机器学习作为战略重点。

谷歌开发了自己的芯片 Pixel Visual Core,以帮助人工智能相关的图像处理。

苹果最新的 A12 仿生芯片采用八核神经引擎,可在 Core ML 中运行任务,直接连接到图像处理器,速度比 A11 快九倍。

它可以更好地聚焦并产生更真实的景深。

未来几年谁能拯救手机的拍照功能?

因此,芯片对于机器学习的效率和性能至关重要。

值得注意的是,谷歌的算法是在大型计算机上训练的。

大型计算机拥有先进的GPU和NVIDIA深度学习Tensor Core(张量计算核心),大部分工作都可以“提前”完成。

一旦机器学习的计算能力转移到移动设备上,可以预见它将在很长一段时间内成为前沿研究。

即使在计算摄影的早期阶段,神经引擎也可以减轻手机拍照的处理负担,并且随着时间的推移运行得越来越快。

拍照是任何手机最基本的功能。

Face ID、人脸识别解锁、AR视频、AI人像、风景美化、相册智能分类、智能场景识别……近两年已经深入到普通人的日常生活中。

《年中国人工智能手机行业研究报告》显示,语音处理、人脸解锁、智能补光、美颜、图像识别已成为今年中国AI智能手机用户最常使用的TOP5功能。

人脸解锁、语音录音、随身翻译、智能补光、AI双/三摄、背景虚化成为用户认为最有价值的TOP5功能。

雷锋网认为,指数级增长遇到物理极限的“天敌”,无休无止的增长逐渐放缓。

未来几年谁能拯救手机的拍照功能?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 华天科技与合作伙伴成功研发硅基扇出封装技术,良率超过98%

    华天科技与合作伙伴成功研发硅基扇出封装技术,良率超过98%

    近日,华天科技(昆山)电子有限公司与江苏威源芯微系统科技有限公司联合研发某毫米波雷达芯片硅基扇出封装已成功,产品封装良率大于98%,现已进入小批量生产阶段。 华天科技(昆山)公司开发出具有自主知识产权的硅基扇出封装技术,具有多芯片高密度系统集成、超薄、超小型

    06-06

  • 苏州科艺半导体核心装备领域专项磁悬浮分子泵项目预计明年投产

    苏州科艺半导体核心装备领域专项磁悬浮分子泵项目预计明年投产

    据苏州科技城官方微信,目前,苏州中科科艺半导体核心装备领域专项磁悬浮分子泵项目成果转化平台已完成主体结构全面封顶,预计2019年正式投入使用。 据悉,项目建成后将具备生产0磁悬浮分子泵的能力每年泵、检漏工程设备和检漏仪。 它将通过工业化发挥规模效益,打造长三角地

    06-06

  • 介入医疗器械CDMO先行者,上海「昊峰医疗」完成Pre-A轮融资

    介入医疗器械CDMO先行者,上海「昊峰医疗」完成Pre-A轮融资

    投资界(ID:pedaily)5月20日消息,上海昊峰医疗科技有限公司(以下简称“昊峰医疗”) 》))宣布完成数千万元Pre-A轮融资。 本轮融资由时萃资本领投,灵脉医疗基金跟投。 募集资金将用于建设高分子材料平台、扩大产能以及招募CDMO平台人才,以更好地满足全球介入医疗器械品

    06-18

  • Datablau获得线性资本数千万元A轮融资,

    Datablau获得线性资本数千万元A轮融资,

    Datablau近期完成数千万元A轮融资,投资方为线性资本。 FA就是猎云资本。 听,中小企业反馈平台。 倾听用户需求,倾听创业者声音,解决中小企业痛点。 点击立即参与调查并获得礼物。

    06-18

  • 【融资24小时】2022年2月28日投融资事件汇总及明细

    【融资24小时】2022年2月28日投融资事件汇总及明细

    2022年2月28日 今日国内市场共发生35起投资披露事件,其中9起为企业服务(炎凰数据、云纳科技、树华科技、钛金科技、耀明创新、奥索纳、西游科技、云数讯联、博鼎国际)8家先进制造案例(纽迪瑞、科通、木创集成电路、大族数控、中科国盛、图灵量子、六芬科技、北京硅谷智能)

    06-18

  • 汽车OTA解决方案提供商艾拉比宣布获得1000万美元A轮融资

    汽车OTA解决方案提供商艾拉比宣布获得1000万美元A轮融资

    投资圈(微信ID:pedaily)据11月30日消息,汽车OTA解决方案提供商“艾拉比”宣布获得A轮1万美元融资A轮融资,由张江高科领投,张江科投、凯辉基金跟投。 本轮融资将主要用于新增其他OTA相关软件产品线、布局大数据领域、开拓海外市场。 艾拉比于今年10月上台。 主要为汽车和

    06-18

  • 字节跳动否认已完成支付牌照的收购,但财务野心一直都在,

    字节跳动否认已完成支付牌照的收购,但财务野心一直都在,

    2月15日投资界消息。 今日有消息称“北京字节跳动科技有限公司完成支付牌照收购”。 昨天,北京商报报道,字节跳动相关人士负责人回应称,网上有关“字节跳动完成支付牌照收购”的传言不实。 不过,业内人士指出,字节跳动否认此举可能是基于央行批准的不确定性。 今年春节期

    06-17

  • 马斯克又要睡工厂了

    马斯克又要睡工厂了

    马斯克又要睡工厂了,利润七年来首次下降。 年度财报显示,孔夫子自2008年以来首次出现年度利润下滑,第四季度利润下降40%。 营收和每股收益均低于预期,收盘后股价下跌5%。 2017年,孔夫子调整后息税折旧及摊销前利润(EBITDA)为1亿美元,较2017年的1亿美元下降13%。 虽然孔

    06-17

  • 心脉医疗:一季度营收1.97亿元,同比增长99.07%

    心脉医疗:一季度营收1.97亿元,同比增长99.07%

    心脉医疗发布今年一季报。 报告显示,本季度心脉医疗营收1.97亿元,同比增长99.07%;归属于上市公司股东的净利润1.02亿元,同比增长70.96%。

    06-18

  • 成像声纳技术开发商博海深衡获新一轮融资,中科开物创投独家投资

    成像声纳技术开发商博海深衡获新一轮融资,中科开物创投独家投资

    据7月9日消息,宁波博海深衡科技有限公司(以下简称:博海深衡)成像声纳技术研发,完成最新一轮融资,由中科开物创投独家投资。 本轮融资主要用于深度强化公司核心技术研发能力,量产系列声纳产品,为我国海洋经济发展和国防建设贡献力量。 据了解,博海深衡成立于2008年,

    06-18

  • 原商汤研究院院长创办,拓元智慧完成天使轮融资

    原商汤研究院院长创办,拓元智慧完成天使轮融资

    投资界(ID:pedaily)消息,拓元智慧完成来自卓源资本、元数资本的天使轮投资。 公开资料显示,拓元智慧公司由商汤科技研究院前高管林院长博士创立。 是一家涵盖消费、娱乐、零售等跨行业领域的虚拟数字智能技术提供商。 它以认知人工智能技术为核心,以文本技术为核心。 、

    06-18

  • 曹妃甸新天液化公司获近8亿战略融资

    曹妃甸新天液化公司获近8亿战略融资

    据投资界(ID:pedaily)8月26日消息,新天绿色能源与河北建投近日签订增资协议。 曹妃甸公司增加注册资本7.99亿元。 新天绿色能源和河北建投按照各自持股比例认购。 其中,新天绿色能源应缴纳4.07亿元,河北建投应缴纳3.9亿元。 2017年增资完成后,新天绿色能源和河北建投在

    06-18