首页 > 技术迭代 > 内容

手机拍照自动剪图,秒变PS素材:中国团队技术实现一键“切现实”

发布于:2024-06-28 编辑:匿名 来源:网络

近日,一段模糊虚拟与现实界限的黑科技视频火了在 Twitter 上,已经收到了数万次浏览。

点赞并转发。

视频中,开发者西里尔·Diagne用手机拍摄了周围的绿色树枝、书籍、衣服等物体,手机立即将这些物体拉出了屏幕。

接下来发生的事情更神奇:他将手机摄像头对准电脑屏幕,刚刚剪下的物体就自动添加到了电脑上运行的Photoshop中!几秒钟前现实中的物体被复制到虚拟世界中。

可能让很多摄影师和设计师的朋友感到嫉妒的是,Diagne的操作完全是自动化的。

没有使用数据线,没有触动键盘,更没有使用鼠标进行任何调整——剪切粘贴的图像就那么准确地出现在他用手机瞄准的屏幕位置上。

Diagne将这项令人惊叹的剪切技术命名为AR Cut Paste。

手机拍照自动剪图,秒变PS素材:中国团队技术实现一键“切现实”

目前,对Photoshop的支持已经开发出来,但他也表示其他软件也可以支持。

他还将 AR Cut Paste 放到了 GitHu b 上并开源。

从介绍和代码中,我们可以一窥这样一个有趣的技术是如何实现的。

揭秘:中国团队开发的图像识别模型AR Cut Paste在图像剪切阶段使用了名为BASNet的深度神经网络。

过去,机器学习领域在利用深度卷积神经网络进行物体识别方面取得了非常好的成果。

然而,通过神经网络进行图像中对象识别的主要目标是区域精度,而不是边界精度。

简单来说,这些物体识别技术可以准确地回答图片中的物体是什么:但很难准确地画出识别出的物体的边界:于是,加拿大阿尔伯塔大学的一个研究人员组成了一个以华人为主的团队人们开发了一种新的深度神经网络模型。

BASNet的主要功能是进行显着性检测。

简单来说,就是实现对图片中最显着物体的精确边界勾画。

效果就像PS大师手工“剪出”的一样。

BASNet采用预测-优化思想,主要采用Encoder-Decoder网络结构,底层采用微软团队开发的残差网络ResNet。

在预测部分,密集监督的编码器-解码器网络负责预测预测图片中对象的显着性。

借助三种不同的损失函数,神经网络可以预测图片(像素)、像素区域(补丁)和全图像(地图)中对象的显着性。

) 在这三个级别上进行显着性判定,以输出更准确的结果。

在优化部分,Encoder-Decoder结构仍然被组装成残差优化模块(RRM),以进一步优化预测部分输出的显着性图。

从下图可以看出,与其他同类相似的物体识别模型相比,BASNet的边界勾画效果相对更加准确,最接近人工绘制的标准答案。

不仅如此,BASNet 在优化计算性能方面也做得很好,在单个 GPU 上运行速度可达每秒 25 帧(你的电脑需要有支持 CUDA 的 GPU)。

该论文去年被计算机视觉顶级学术会议CVPR收录。

BASNet开发团队来自加拿大阿尔伯塔大学计算机科学系。

第一作者为该校机器人与视觉实验室秦学斌博士。

曾就读于山东农业大学、北京大学。

从网站上也可以清楚地看到,各种图像和视频中的物体显着性/边界勾勒是秦学斌最有效的研究:秦学斌团队还推出了更强大的模型U^2-Net,复杂物体边缘的识别精度有了提升。

达到了一个新的水平。

这篇新论文目前包含在《模式识别》中。

现在我们知道AR Cut Paste利用了深度神经网络BASNet来实现更精准的剪切。

接下来,开发者Diagne是如何将手机上剪下来的图片直接“放置”到电脑上,并精准地放置在手机瞄准位置的呢?在这里,Diagne使用了他开发的一个小工具 ScreenPoint。

简单来说,他在一张照片(手机发回的屏幕)上确定了一个锚点,然后在对应的照片(电脑屏幕)上放置了一个锚点。

找到锚点对应的坐标。

这个小工具使用了OpenCV的SIFT功能。

目前,AR 剪切粘贴在剪切阶段的延迟约为 2.5 秒,在粘贴阶段的延迟约为 4 秒。

Diagne还在推特上表示,有很多方法可以进一步减少延迟,但他没有花更多时间优化核心功能之外的内容。

技术实现的逻辑听起来并不是特别复杂,但得益于强大的 BASNet 和 Diagne 的想象力,AR Cut Paste 的实际效果还是很神奇的——特别是对于那些每天和 lasso 打交道的 Photoshop 用户来说……看过之后AR Cut Paste的配置,相信你已经迫不及待想要上手亲自玩玩AR Cut Paste了。

Diagne自己的GitHu提供了您需要的所有代码和简单的说明手册。

点击文章下方“阅读原文”即可查看。

总体而言,AR Cut Paste 具有三个需要一起使用的独立模块:移动应用程序、安装在计算机上的本地服务器以及打包的 BASNet HTTP 服务。

手机是你的互动工具;本地服务器是手机与Photoshop之间数据传输的接口;对象检测、边界描绘和背景去除的操作发生在 BASNet HTTP 服务上。

本地配置AR Cut Paste需要手机和具有支持CUDA GPU的电脑;配置过程需要您有一定的React Native移动应用开发支持,并且计算机上有Python或Docker开发环境。

配置Photoshop插件远程连接 进入Photoshop的首选项插件(Plug-ins),打开远程连接(Remote Connection),并设置密码。

然后在 GitHu b Repo 中找到 cyrildiagne/ar-cutpaste/server/src/ps.py 并确保你的 Photoshop 设置与此文件中的相同,否则粘贴的图层将是空白图层。

要打包 BASNet HTTP 服务,首先克隆 cyrildiagne/basnet-http: git clone repo,然后将阿尔伯塔大学团队的 BASNet 克隆到其中。

git clone BASNet模型文件basnet.pth(shorturl.at/FVZ19,下载地址也可以在BASNet HTTP打包工具的GitHu b页面找到)放到BASNet/saved_models/basnet_bsi/路径下。

配置本地服务器,然后开始构建服务。

您可以在本地使用Python运行环境virtualenv(需要Python v3.6或以上版本),也可以使用Docker。

具体操作方法可以在GitHu b上找到。

然后就可以运行服务器了。

记得输入打包好的BASNet HTTP服务的IP地址(X.X.X.X),以及上一步在Photoshop中设置的远程连接密码(56): python src/main.py \ - -basnet_service_ip=" \ --basnet_service_host=" basnet-http.default.example.com" \ --photoshop_password 56 配置手机客户端 手机客户端是Diagne自己使用React Native开发的一款App,下载代码,安装,连接手机,点IP即可需要强调的是,目前AR Cut Paste只是一个研究原型产品,并不是原型。

它是面向消费者的 Photoshop 工具,因此请谨慎使用,以避免不必要的 Photoshop 数据丢失。

手机拍照自动剪图,秒变PS素材:中国团队技术实现一键“切现实”

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 真融服务预计2020年净利润同比增长超过55%

    真融服务预计2020年净利润同比增长超过55%

    真融服务预计全年未经审计综合净利润较截至12月止大幅增长超过55% 31.

    06-18

  • 88棒棒节“云促销”限时折扣50%,帮助初创企业提升品牌影响力

    88棒棒节“云促销”限时折扣50%,帮助初创企业提升品牌影响力

    近日,阿里云“88棒棒节”正式开启。 阿里云创新中心推出“云推广”衍生品——“企业沟通稿件模板”。 小微企业可扫描下方二维码,一键免费获取。 该模板基于多年经验,由专业媒体编辑团队打磨,包含公司开发的多个品牌推广场景。 通过这套模板,企业还可以打磨出更受媒体和

    06-18

  • 东南亚经济型酒店RedDoorz完成7000万美元融资,启明创投参与投资,

    东南亚经济型酒店RedDoorz完成7000万美元融资,启明创投参与投资,

    投资行业8月20日,东南亚酒店管理及预订平台RedDoorz近日完成7000万美元融资,启明创投参与本次投资。 本次融资是其C轮融资的一部分。 RedDoorz总部位于新加坡,目前业务遍及新加坡、印度尼西亚、菲律宾和越南的80多个城市,经营多家经济型酒店和物业。 据了解,RedDoorz将利

    06-17

  • 庆春半导体完成数亿元A+轮融资,蔚来资本、士兰微、银杏谷、华登联合领投

    庆春半导体完成数亿元A+轮融资,蔚来资本、士兰微、银杏谷、华登联合领投

    投资圈(ID:pedaily)4月26日消息,庆春半导体(宁波)有限公司(以下简称“庆春半导体”) )近日宣布完成数亿元A+轮融资。 本轮融资由蔚来资本、士兰微及其战略基金、华登国际联合领投。 老股东GLVentures继续投资。 同时还获得了宏微科技及多家电源、光伏企业的投资。 全

    06-18

  • 全球首个区块链搜索引擎公司米读亮相,天使轮融资背后多位明星资本加持

    全球首个区块链搜索引擎公司米读亮相,天使轮融资背后多位明星资本加持

    投资界消息,10月31日,全球首个区块链搜索引擎产品(上线北京今日召开新闻发布会,邀请全球区块链社区成员参与产品公测,同时宣布米读已完成超级天使轮融资。   米读是全球第一家区块链搜索引擎公司。 米读的创始团队堪称豪华。 除了追梦基金和创新谷创始人和朱波,以及联

    06-18

  • 北京君正投资元和普华

    北京君正投资元和普华

    投资界-Decode LP获悉,近日,北京君正发布公告,公司作为有限合伙人及专业投资机构苏州粤海同心企业管理合伙企业(有限合伙)等有限合伙企业合伙人签署《苏州元禾璞华智芯股权投资合伙企业(有限合伙)合伙协议》共同投资苏州元和浦华致信股权投资合伙企业(有限合伙)。 该

    06-18

  • 雷军再次食言:小米智能手表年底推出

    雷军再次食言:小米智能手表年底推出

    PingWest品玩从接近深圳厂商的可靠渠道获悉:小米科技已开始量产公司首款智能手表产品。   此前,小米创始人和董事长雷军都曾表示“暂时不做手表”,但仔细想想,小米怎么能错过呢?   获悉,这款正在量产的传奇智能手表预计将于今年年底前发布。 如果是这样,它可能是第

    06-17

  • AI教育公司五灵科技完成战略融资,商汤投资科技

    AI教育公司五灵科技完成战略融资,商汤投资科技

    据投资界1月2日消息,据相关媒体报道,AI教育公司五灵科技近日完成商汤战略融资。 本轮融资将用于产品开发。 迭代并拓展市场。 投资界此前曾报道五菱科技获得1.5亿元Pre-A轮融资,但具体投资方当时并未透露。 公开资料显示,五菱科技成立于2019年9月,是一家致力于人机交互的

    06-18

  • 台积电有望为 2020 款 iPhone 生产 5 纳米 A 系列芯片

    台积电有望为 2020 款 iPhone 生产 5 纳米 A 系列芯片

    据外媒报道,似乎芯片制造商台积电(TSMC)有望为 2020 款 iPhone 生产 5 纳米 A 系列芯片。 我们听说台积电早在去年初就在为这一目标做准备,当地时间周一的一份新报告称,该公司刚刚达到了一个重要的里程碑。 台湾《电子时报》报道称,台积电的5nm芯片设计基础设施现已完成

    06-06

  • “盲盒第一股”泡泡玛特今日在港股上市,首日开盘涨幅超过 100%

    “盲盒第一股”泡泡玛特今日在港股上市,首日开盘涨幅超过 100%

    ,创造了头条新闻。 今天,“盲盒第一股”泡泡玛特正式在港股上市。 股票代码为“.HK”,发行价为38.50港元/股,首日高开%,报77.1港元/股,市值1亿港元,成为引领国内时尚文化第一股。 泡泡玛特今年11月成立,至今已经整整10年了。 十年间,泡泡玛特从简单的买手介绍、传统门

    06-18

  • 【直播预告】创业黑马姚宁:抓住企业财税六大弱点,创业者如何树立健康财税理念

    【直播预告】创业黑马姚宁:抓住企业财税六大弱点,创业者如何树立健康财税理念

    金税工程第四期正式启动,中国税收工作进入“以数治税”时期。 大多非金融背景的创始人在企业税收问题上总是有很多疑问:如何解决持股的税收困境?企业账户外流严重,形成两个账户怎么办?因购票冲账导致财税处理不规范怎么办?税务业务模式不完善、合规成本难以承受如何应对

    06-17

  • 深交所发布新三板挂牌公司转板创业板办法

    深交所发布新三板挂牌公司转板创业板办法

    2月26日,深交所正式发布《深圳证券交易所关于全国中小企业股份转让系统挂牌公司向创业板转板上市办法(试行)》,明确了转板上市各项制度安排,规范转让上市行为。

    06-18