首页 > 技术迭代 > 内容

Meta新模型“分割一切”：切割完成终极进化，计算机视觉迎来GPT-3时刻

发布于：2024-06-28 编辑：匿名来源：网络

对于每个看过漫威的人来说，钢铁侠头盔无疑是每个人都想拥有的装备。

通过这款头盔，你可以一目了然地识别和标记你面前的所有人和物体，并看到这些事物的独特数据和特征。

现在，Meta 正在将这一科幻愿景变为现实。

当巨头与巨头目前在 AIGC 领域激战时，Meta 却悄然在人工智能的另一个重要分支——计算机视觉领域有了大动作。

周三，元研究部发布了一篇名为《Segment Anything》的论文，介绍了一种新的 Segment Anything Model (SAM)，可用于识别图像和视频中的对象。

即使是人工智能从未接受过训练的物品。

所谓“切分”，用最通俗的话说，就是抠图。

但Meta这次展示的人工智能抠图能力可能远比你想象的要强大。

甚至被认为是人工智能领域计算机视觉的“GPT-3时刻”。

一键识别图片和视频，随心所欲。

虽然智能剪切并不是什么新鲜事，但如果你尝试过使用P图软件剪切图片和更换背景，你会发现想要快速剪切照片并且剪切准确自然其实是一件费时费力的事情。

艰巨的任务。

从技术角度来看，“裁剪”数字图像一直是计算机视觉领域的一项经典且复杂的任务。

关键的难点在于识别的时间和准确性。

Meta此次发布的SAM可以说提供了近乎完美的解决方案。

对于任何照片，Meta 都可以快速识别照片中的所有物体，并智能地将它们分割成不同的形状和板块。

您可以单击图片中的任何项目来单独处理它。

这个SAM的一个重大突破是，即使是训练过程中从未遇到过的物品和形状，也可以被人工智能准确地识别和分割。

除了简单地识别图片中的物体之外，这次SAM还支持用户使用各种交互方式来分离出想要的物体。

例如，您可以通过将鼠标悬停在对象上来自动定位对象的轮廓。

即使在人眼难以快速区分的颜色或反射非常相似的图片中，SAM 也可以非常准确地找到轮廓边缘。

再比如，你也可以直接通过输入文字进行查询，AI可以帮你在图片中找到并标记出你要找的文字对象。

不仅是静态图片，无论是视频中的物体，SAM都可以准确识别并快速标记物体的类型、名称、尺寸，并自动用ID记录和分类这些物体。

Meta表示，这项技术未来将广泛与AR/AR耳机结合。

这听起来是不是有点像钢铁侠头盔？看到这里你是不是已经感觉棒极了？别担心，Meta这次又有大动作了。

除了从图像中准确分离对象之外，SAM 还可以支持对象的编辑。

换句话说，你可以改变这个模特的衣服，也许改变颜色和尺寸，然后把它换到另一个模特身上。

您还可以从静态图片中“剪出”椅子，进行3D渲染和编辑，并使其立即从图片中移动。

然后您可以更改形状或执行更多创意操作。

GPT-3时刻在计算机视觉领域开辟了更广阔的应用空间。

Meta发布SAM后，立即引起了广泛关注。

甚至在很多人工智能行业人士眼中，SAM的出现可以说是计算机视觉领域的GPT-3。

时间。

NVIDIA人工智能科学家Jim Fan表示，SAM这次最大的突破在于，它基本上已经能够理解“物品”的一般概念，甚至对于未知物体和陌生场景（例如水下和显微镜中的细胞）也是如此。

可以更准确的理解。

因此，他表示相信SAM的出现将是计算机视觉领域的GPT-3时刻。

Meta新模型“分割一切”：切割完成终极进化，计算机视觉迎来GPT-3时刻

不仅Jim有这样的观点，一些人工智能研究专家甚至说SAM之于计算机视觉就像GPT之于大型语言模型。

昨天SAM刚发布，很多人就立即上手测试。

硅星人浏览一圈，发现不仅满屏基本都是惊叹之人，而且一些网友还根据自己的工作领域，为SAM开辟了更广阔的应用空间。

当有人上传包含许多复杂元素的图片后，SAM 可以毫无压力地识别它。

无论是近景还是远景，大量复杂细微的元素基本都能准确识别。

一些自然科学研究人员将SAM与卫星图像结合起来，称SAM可以很好地识别和找到他标记的特征类型。

神经外科和影像学专家在脊髓血管疾病的病例档案中使用了SAM，认为SAM对于帮助判断和分析病情非常有帮助。

一位生物学家输入了显微镜下组织的图片。

即使图片中的形状特征不规则，借助零样本技术，SAM也可以自动识别多细胞结构中的腺体、导管、动脉等。

生物学家认为，SAM的输出结果非常接近完美，可以节省未来大量的手动注释时间。

也有骑行爱好者将地图与SAM结合起来，认为可以帮助自己以后更快、更高效地标记地图。

基于数万张照片的训练，模型和数据全部开源。

总体而言，与过去的一些计算机视觉模型相比，SAM 在几个方面都有显着的改进和差异。

首先，SAM与Prompt进行了创新性的结合。

它可以接受各种输入提示，例如单击、框选择或指定要分割的对象。

该输入不是一次性命令。

您可以继续对图像发出不同的命令以达到最终的编辑效果。

这也意味着此前用于自然语言处理的Prompt模式也开始应用于计算机视觉领域。

此外，SAM 还接受了包含 10,000 张图像和 11 亿个掩模的海量数据集的训练，这是迄今为止最大的分割数据集。

该数据集涵盖了广泛的物体和类别，例如动物、植物、车辆、家具、食物等。

这些图像的分辨率达到×像素，平均每张图像大约有一个掩模。

这次 SAM 使用轻量级掩码解码器，每次提示只需几毫秒即可在 Web 浏览器中运行。

SAM 在各种分割任务上具有很强的零样本性能。

零样本意味着 SAM 无需针对特定任务或领域进行任何额外的训练或微调即可分割对象。

例如，SAM 可以在没有任何事先知识或监督的情况下对面部、手、头发、衣服和配饰进行分割。

SAM 还可以以不同的方式分割对象，例如红外图像或深度图。

SAM的训练数据集是OpenImage V5的6倍。

Meta表示，公司内部已开始使用SAM相关技术，用于Facebook和Instagram等社交平台上的照片标记、内容审查和内容推荐。

之后，生成式人工智能作为“创意辅助”也将作为今年的重点优先事项纳入更多 Meta 应用中。

这次，可能最让很多业内人士惊讶的是，SAM模型和庞大的训练数据集都开源了！换句话说，目前任何人都可以在非商业许可下下载和使用 SAM 和数据。

Meta表示，此举旨在进一步加速业界对图像分割以及更通用的图像和视频理解的研究。

Meta还预测，随着SAM的演进和发展，这项技术未来可能会成为AR/VR、内容创作、设计等更多领域的强大辅助工具。

作为一种新兴的研究模型，目前使用SAM的门槛其实并不高。

即使你是一个完全不懂AI的普通用户，也可以在segment-anything平台上亲身体验它神奇的抠图功能。

站长声明

标签：

上一篇：滴滴“造”车，不仅仅是为了卖

下一篇：被遗忘的水货iPhone

转型！家电集体出逃巨头

软体机器人在机器人领域并不是一个非常主流的概念，但现在越来越多的研究机构正在研究这种新型机器人。电影中的大白形象是软体机器人最典型的代表。近日，波兰华沙大学物理学院研究人员成功研制出15毫米软体机器人。这是一个由液晶弹性体（LCEs饰）制成的软机器人，在可见

06-17
投资世界24小时 -神舟十二号今日回家；威马或减资或准备海外上市；淘宝直播取代负责人

重要消息一双千元跑鞋如今可以支撑1亿元的市值。你可能没有想到，一双跑鞋撑起了1亿的市值。据投资界9月16日消息，瑞士运动品牌On昨晚正式在纽交所挂牌上市，股票代码为“ONON”。本次IPO，On发行价为24美元，开盘即暴涨48%。截至收盘，公司市值为95亿美元（约合人民币1亿

06-17
英特尔加码汽车芯片、芯片与变量

北京时间9月7日，英特尔CEO帕特基辛格发表了今年2月上任以来的首次现场演讲。演讲的场合是慕尼黑车展。帕特用这样一句话作为他演讲的开场白：“为什么一个做半导体的人会站在世界上最重要的车展的领奖台上？”帕特给出了两个答案：英特尔推出代工服务加速器计划，帮助汽车芯

06-08
小鹏汽车获广东省产业发展基金5亿元战略投资

近日，小鹏汽车宣布与广东粤财投资控股有限公司达成战略合作，双方将投资广东省产业发展基金，小鹏汽车子公司广州橙行智动汽车科技有限公司达成5亿元合作协议。省工业和信息化厅党组成员、副厅长吴红，财务审计室主任谌志群，何小鹏，小鹏汽车首席执行官董事长，副总裁资深

06-17
价格并不是小米成功的关键

上周，备受关注的小米汽车首次正式亮相。在这场长达三个小时的发布会上，雷军传达了海量信息：他不仅深入探讨了小米的造车理念，还展示了团队在电驱、电池、大型压铸、以及智能座舱和智能驾驶。核技术，终于首次公开了小米首款汽车——小米SU7的细节。回顾年初小米宣布造车

06-18
北恒生物获得德诚资本约亿元A轮融资，德诚资本投资

据投资界2月14日消息，北恒生物科技宣布完成约1亿元A轮融资。此次融资由德诚资本独家提供。结束。通过本轮融资，北恒生物与德诚资本达成深度合作，持续完善人才引进和GMP设施建设，同时推动通用型肿瘤免疫产品的开发和临床转化。据悉，北衡生物是一家专注于通用细胞治疗

06-18
外卖平台Hungry获2000万美元B轮融资

据投资界3月8日消息，据36氪报道，外卖平台Hungry近日获得2万美元B轮融资。投资者包括 Evolution VC Partners 和全食超市前首席执行官沃尔特罗伯 (Walter Robb)。、演员凯文哈特、说唱歌手Jay-Z和几位 NFL 球员。据Crunchbase信息显示，Hungry迄今获得的融资总额已达1万美

06-18
跨境电商售后运营服务商“愚公科技”完成近千万元Pre-A轮融资

据投资界（ID：pedaily）7月19日消息，据36氪获悉，跨境电商售后运营服务商深圳市愚公科技有限公司（以下简称愚公科技）近日宣布完成老字号Pre-A轮近千万元融资股东，TSN Capital 担任独家投资者。据介绍，这笔资金将主要用于市场营销、模型训练和产品迭代。 “愚公科技”成

06-17
美光科技警告：因PC客户面临其它零部件短缺芯片需求将下滑

美光科技警告：由于个人电脑客户面临其他零部件短缺，芯片需求将下降芯片需求下降的原因是制造个人电脑 (PC) 的客户面临其他零部件短缺。消息公布后，美光科技股价周二收盘后下跌7%至67.99美元，最终跌幅为3.57%。该公司还表示，其供应链中的一些零部件正面临短缺。美光是

06-08
有人说实话：Unity CEO说2016年不是VR元年

人在世间，身不由己。从1月7日消费者版Oculus Rift头盔正式开启预购，到中国火爆的全球移动互联网大会，VR热点几乎每天轮流刷爆朋友圈。在国内，HTC举办了两次会议，一次是开发者大会，一次是生态大会。暴风魔镜、大朋、Pico、3Glasses等厂商也举办新品发布会秀肌肉。各种

06-18
宝宝树2019年中报：月均活跃用户1.56亿，海外投资持续落地

投资界消息，8月27日晚，宝宝树集团（.HK）发布中报：年平均月活跃用户上半年用户规模达1.56亿，其中，年平均App月活跃度较年平均增长21.6%，收入突破2.4亿元，继续保持在母婴互联网行业的领先优势。与此同时，宝宝树宣布完成对多家美国年轻家庭服务公司的投资，加速全球战略

06-18
南京软件谷：集成电路产业联盟成立，胜科纳米等签约，

集微网消息，5月24日，南京软件谷集成电路产业联盟成立。同时，仪式上还举行了胜科纳米、安思江、新云电子等重大项目签约仪式。据悉，软件谷集成电路产业联盟将为软件谷企业提供创新、展示、交流、合作的平台。首批会员单位共29家，以中兴光电为会长单位，太智科技、江苏新

06-08