首页 > 科技未来 > 内容

反思深度学习与传统计算机视觉的关系

发布于:2024-06-18 编辑:匿名 来源:网络

雷锋网注:【图片来源:谷歌所有者:Google】如今,深度学习在很多领域都占有一席之地,尤其是在计算机视觉领域。

尽管很多人对它着迷,但深网是一个黑匣子,我们大多数人,甚至是接受过该领域培训的科学家,都不知道它们实际上是如何工作的。

大量与深度学习相关的成功或失败案例给了我们宝贵的教训,教会我们如何正确处理数据。

在这篇文章中,我们将仔细研究深度学习的潜力、它与经典计算机视觉的关系,以及将深度学习用于关键应用的潜在危险。

简单和复杂的视觉问题首先,我们需要对视觉/计算机视觉问题有一些看法。

原则上可以理解为,给定一张由相机拍摄的图像,并允许计算机回答与图像内容相关的问题。

问题的范围可以从简单的问题(例如“图像中是否有三角形”、“图像中是否有一张脸”)到更复杂的问题(例如“图像中是否有狗在追猫”)。

虽然这些类型的问题对人类来说可能看起来相似甚至微不足道,但事实证明它们隐藏的复杂性存在巨大差异。

虽然回答“图像中是否有红色圆圈”或“图像中有多少个亮点”等问题相对容易,但其他看似简单的问题(例如“图像中是否有猫”)要复杂得多。

“简单”视力问题和“复杂”视力问题之间的区别很难区分。

这是值得注意的,因为上述问题对于人类这种高度视觉的动物来说都不够困难,甚至对于儿童来说,回答上述视觉问题也不难。

然而,变革时期的深度学习无法回答这些问题。

传统计算机视觉 V.S.深度学习 传统计算机视觉是一系列算法的广泛集合,允许计算机从图像中提取信息(通常表示为像素值数组)。

目前,传统的计算机视觉有很多用途,例如去噪、增强和检测不同的物体。

一些用途旨在寻找简单的几何基元,例如边缘检测、形态分析、霍夫变换、斑点检测、角点检测、各种图像阈值技术等。

还有特征表示技术,例如定向梯度直方图,可以用作前端-机器学习分类器最终可以构建更复杂的检测器。

与普遍的看法相反,上面讨论的工具可以组合起来创建强大而高效的特定于对象的检测器。

除此之外,我们还可以构建人脸检测器、汽车检测器、路标检测器,这些检测器在准确性和计算复杂性方面可能优于深度学习。

问题是,每个探测器都需要由有能力的人员从头开始构建,效率低下且成本高昂。

因此,从历史上看,高性能探测器仅适用于那些必须经常检查且前期投资合理的探测器。

其中许多探测器是专有的,不向公众开放,例如面部探测器、车牌读取器等。

但头脑清醒的人不会花钱编写狗检测器或分类器来从图像中对狗的品种进行分类。

所以,深度学习就派上用场了。

对优秀学生的启发假设您正在教授计算机视觉课程。

前半段课程,你要带领学生复习很多专业知识,然后留出时间给学生完成任务,就是收集图像内容和提出问题。

任务从简单开始(例如询问图像中是否有圆形或正方形)到更复杂的任务(例如区分猫和狗)。

学生每周编写计算机程序来完成任务,而您负责查看学生编写的代码并运行它以查看其性能如何。

这个学期,你们班来了一位新学生。

他很安静,不爱交际,也不问任何问题。

但当他提交第一份任务提案时,你有点惊讶。

新生的代码难以理解,你从来没有见过类似的东西。

看起来他用随机过滤器对每张图像进行了卷积,然后使用非常奇怪的逻辑得到了最终答案。

您运行了这段代码,它运行得很好。

尽管这个解决方案很不寻常,但你心里想,只要它有效就足够了。

随着时间的推移,学生需要完成的任务变得越来越困难,并且你从新学生那里得到的代码也越来越复杂。

他的代码出色地完成了越来越困难的工作,但你无法真正理解发生了什么。

在学期结束时,您给学生布置了一项作业,要求他们使用一组真实图片来区分猫和狗。

结果,没有学生能够在这项任务上达到超过 65% 的准确率,但新生编写的代码准确率达到 95%,这会让你感到惊讶。

在接下来的几天里,你开始深入研究那些难以理解的代码。

你给它新的例子,然后进行修改,尝试找出影响程序决策的因素,并对它们进行逆向工程。

最终你得出一个非常令人惊讶的结论:代码检测到狗牌。

如果它可以检测到标签,那么它就可以判断物体的下部是否是棕色的。

如果是,则返回“cat”,否则返回“dog”。

如果无法检测到标签,则会检查物体的左侧是否比右侧更黄。

如果是,则返回“dog”,否则返回“cat”。

您邀请新学生到您的办公室并向他展示结果。

你问他是否认为自己真的解决了问题?沉默良久,他终于自言自语道,他已经解决了数据集中显示的任务,但他不知道狗长什么样,也不知道狗和猫有什么区别……显然,他作弊是因为他解决任务的目的与你想要的目的无关。

然而,他并没有作弊,因为他的解决方案确实有效。

然而,其他学生的表现却不尽如人意。

他们试图通过问题来解决任务,而不是通过原始数据集。

虽然他们的程序运行得不太好,但是并没有犯什么奇怪的错误。

深度学习的祝福和诅咒深度学习是一种使用称为梯度反向传播的优化技术来生成“程序”(也称为“神经网络”)的技术,就像上面故事中的学者所写的那样。

这些程序是相同的。

这些“程序”和优化技术对世界一无所知,它所关心的是构建一组转换和条件,将正确的标签分配给数据集中的正确图像。

虚假偏差可以通过向训练集中添加更多数据来消除,但由于有数百万个参数和数千个条件检查,反向传播生成的“程序”可能非常庞大且复杂,因此它们可以锁定具有更细微偏差的组合。

任何通过分配正确标签来统计优化目标函数的方法都可以使用,无论它是否与任务的“语义精神”相关。

这些网络最终能否锁定“语义正确”的先验?当然。

但现在有大量证据表明这些网络并不是这样做的。

相反的例子表明,对图像进行非常小的、难以察觉的修改可以改变检测结果。

研究人员研究了经过训练的数据集的新示例,结果表明,原始数据集外部的泛化能力比数据集内部的泛化能力弱得多,从而表明网络所依赖的给定数据集具有特定的低级特征。

在某些情况下,修改单个像素足以产生新的深度网络分类器。

在某种程度上,深度学习的最大优势在于它能够自动创建没人想到的特征。

这也是它最大的弱点,因为这些功能中的大多数至少在语义上是“可疑的”。

什么时候有意义,什么时候没有意义?深度学习无疑是计算机视觉系统的一个有趣的补充。

我们现在可以相对容易地“训练”探测器来探测物体,否则这些探测器将变得昂贵且不切实际。

我们还可以在某种程度上扩展这些检测器以使用更多的计算能力。

但我们为这种奢侈付出的代价是高昂的:我们不知道深度学习如何做出判断,但我们确实知道分类的基础很可能与任务的“语义精神”无关。

此外,只要输入数据违反训练集中的低级偏差,检测器就会失败。

这些故障情况目前未知。

因此,在实践中,深度学习对于错误不是很严重并且保证输入与训练数据集不会有显着差异的应用非常有用。

这些应用程序可以容忍 5% 以内的错误率,包括图像。

搜索、监控、自动化零售以及几乎所有非“关键任务”的东西。

讽刺的是,大多数人认为深度学习是应用领域的一场革命,因为深度学习决策是实时的,错误很大,甚至可能导致致命的结果,例如自动驾驶汽车、自主机器人(例如,最近的研究表明,基于深度神经网络的自动驾驶确实容易受到现实生活中的对抗性攻击)。

我只能将这种信念描述为对“不幸”的误解。

一些人对深度学习在医学和诊断领域的应用寄予厚望。

然而,在这方面存在一些令人担忧的发现,例如针对一个机构的数据的模型无法很好地检测另一个机构的数据。

这强化了这样的想法:这些模型捕获的数据比许多研究人员希望的要浅。

数据比我们想象的要浅 令人惊讶的是,深度学习教会了我们一些关于视觉数据(通常是高维数据)的知识,这是一个有趣的想法:在某些方面,数据比我们以前想象的“浅”。

“多得多。

”似乎有更多的方法可以统计分离标有高级人类类别的可视化数据集,然后有更多的方法来分离这些“语义正确”的数据集。

换句话说,这组低级图像特征比我们想象的更具“统计显着性”。

这是深度学习的伟大发现。

如何生成“语义上合理”的方法来分离视觉数据集模型的问题仍然存在,事实上,这个问题现在似乎比以前更难回答。

结论深度学习已经成为计算机视觉系统的重要组成部分。

但传统的计算机视觉还没有走到这一步,它仍然可以用来构建非常强大的探测器。

这些手工制作的检测器可能无法在某些特定数据集指标上实现深度学习的高性能,但可以保证依赖于输入的“语义相关”特征集。

深度学习在不牺牲特征工程的情况下提供了统计上强大的检测器,但仍然需要大量标记数据、大量 GPU 和深度学习专家。

然而,这些强大的探测器也会遭受意想不到的失败,因为它们的应用范围无法轻易描述(或者更确切地说,根本无法描述)。

反思深度学习与传统计算机视觉的关系

需要说明的是,上述讨论与“人工智能”中的AI无关。

我不认为深度学习之类的东西与解决人工智能问题有任何关系。

但我确实认为,将深度学习、特征工程和逻辑推理相结合可以在广阔的自动化领域实现非常有趣和有用的技术能力。

雷锋网注:本文编译自Piekniewski的博客 雷锋网注:【封面图片来源:网站名称Google,所有者:Google】雷锋网版权所有文章,未经授权禁止转载。

详情请参阅转载说明。

反思深度学习与传统计算机视觉的关系

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 2023年A股将如何规划?林园、洪浩等五位大咖看好这些优质资产的投资机会!

    2023年A股将如何规划?林园、洪浩等五位大咖看好这些优质资产的投资机会!

    今年市场有起有落。 对于即将到来的一年,每个人都有着未知,也充满着期待。 如何把脉就变得尤为重要。 12月18日至22日,《红周刊》重磅线上投资策略会“前瞻优质资产再现”成功举办。 本次战略会议邀请了深圳市林源投资管理有限公司董事长林源、思瑞集团首席经济学家洪浩、北

    06-18

  • 强网杯:周鸿祎称网络战时代,网络安全软实力必须提升

    强网杯:周鸿祎称网络战时代,网络安全软实力必须提升

    近期,《人民日报》、《新华社》连续发表文章指出美国对我国网络的攻击以及基础设施越来越密集,他们列出了无数的数据。 6月15日,在河南郑州举办的互联网强者论坛上,董事长周鸿祎公司透露,近年来,安全大脑共发现40个渗透潜伏到中国网络的境外APT(高级持续威胁)攻击组织

    06-17

  • 华尔街日报:芯片短缺让德州仪器成为焦点

    华尔街日报:芯片短缺让德州仪器成为焦点

    据《华尔街日报》报道,数字时代最受欢迎的一些设备是模拟半导体,其中包括有91年历史的德州仪器生产的产品。 该公司因其自 20 世纪 70 年代以来生产的计算器而为消费者所熟知。 科技高管表示,今年的供应链瓶颈已经影响到从 iPhone 到福特 F-1 的所有产品,其中模拟芯片的情

    06-08

  • 新驰科技获10亿元B轮融资,加速更先进工艺芯片的研发

    新驰科技获10亿元B轮融资,加速更先进工艺芯片的研发

    创造头条新闻7月26日,新驰科技宣布完成近10亿元B轮融资,主要用于用于研发更先进工艺芯片。 新驰科技成立于2007年,是一家本土汽车芯片公司。 其业务范围涵盖智能座舱、中央网关、自动驾驶、高可靠MCU等,今年3月在“缺芯潮”背景下实现百万片/年订单。 据悉,本轮融资由普罗

    06-17

  • “冰剑科技”完成2.28亿元C2轮融资

    “冰剑科技”完成2.28亿元C2轮融资

    今日,上海冰剑信息科技有限公司宣布完成2.28亿元C2轮融资。 本轮融资由国创中鼎领投,东方富海、西域资本跟投。 跟随投资。 中华创业投资担任C2轮独家代理。 本轮融资主要用于扩大研发团队、上下游投资、完善公司生态建设和业务版图。

    06-18

  • KaaS旗下学习平台“极客帮科技”完成亿元B+轮融资

    KaaS旗下学习平台“极客帮科技”完成亿元B+轮融资

    4nbsp; 3月19日消息:KaaS旗下学习平台“极客帮科技”宣布完成1亿元B+轮融资,由东方富海领投。 赛智伯乐和鑫熙创投为联合投资者,指数资本为独家投资者。 本轮融资将主要用于内容开发、技术研发和市场品牌投入,深化To B、To C驱动的产品矩阵和生态协同,促进数字人才全面发

    06-18

  • 韩媒:中国加大对韩国材料、零部件和设备行业投资

    韩媒:中国加大对韩国材料、零部件和设备行业投资

    今年前9个月,中国对韩国直接投资同比增长25.7%,达50.9亿美元。 大部分投资将投向材料、零部件和设备行业。 据韩国媒体businesskorea报道,虽然中国对韩国投资增速低于欧盟(0.2%)和日本(33.8%),但与其他地区不同的是,这已是连续第三年增长。 去年,美国、日本和欧盟减

    06-08

  • 中国半导体功率器件十强榜单出炉,扬杰电子荣登榜首

    中国半导体功率器件十强榜单出炉,扬杰电子荣登榜首

    近日,中国半导体行业协会分立器件第十三届年会暨中国半导体器件技术创新与产业发展论坛在我市成功举办青岛。 会上,中国半导体行业协会公布了中国半导体行业十大功率器件,让我们更深入地了解了中国半导体行业的这一细分领域。 我们来看看这十家企业: 扬州扬杰科技有限公司

    06-06

  • 瑞幸9.9元的价格战陷入僵局

    瑞幸9.9元的价格战陷入僵局

    第一个“热搜”开启,没想到却撞上了“瑞幸”。 昨天,“瑞幸9.9元杯活动缩水”的消息被推到舆论风口浪尖,一直发酵至今。 原因是,多地网友发现,瑞幸每周9.9元的优惠不再是所有饮品都可以享受,而是加上了很多“限制”。 瑞幸官方客服今日也发布了相关回应。 究竟瑞幸为何做

    06-18

  • 「纽迈医疗」获超1亿美元C轮融资

    「纽迈医疗」获超1亿美元C轮融资

    上海纽迈医疗科技有限公司宣布完成超1亿美元C轮融资。 本轮融资由淡马锡领投,云锋基金、Become Venture Partners Fund及老股东奥博资本(OrbiMed)、大辰资本、博源资本、张科毅、君紫投资等跟投,皓月资本担任跟投本轮融资独家投资方。 本轮融资公司将用于加速结构性心脏病

    06-17

  • 青普生物科技成功获得近5000万元Pre-A轮融资

    青普生物科技成功获得近5000万元Pre-A轮融资

    据投资界9月14日消息,南京青普生物科技有限公司(以下简称“青普生物科技”),专注于疼痛领域改良新药研发,宣布完成近万元Pre-A轮融资。 本轮融资由君联资本领投,天使股东英迪资本继续参与投资。 青普生物专注于于非阿片类镇痛药的研发。 本轮融资将主要用于推进现有项目

    06-17

  • Imagination 任命 Nong Pai 为 Imagination China 董事长

    Imagination 任命 Nong Pai 为 Imagination China 董事长

    7 月 15 日 – Imagination Technologies 宣布任命 Wallace Pai 为 Imagination China 董事长。 白农先生将帮助Imagination进一步深化中国市场战略,以更好地捕捉广泛的市场机遇。 他在战略、销售和业务合作方面拥有丰富的技能和经验,这将推动Imagination的业务持续增长,同

    06-06