首页 > 科技未来 > 内容

漫画风格转移神器AnimeGAN推出了网络版,它可以在2秒内生成图片,效果媲美专业画家

发布于:2024-06-21 编辑:匿名 来源:网络

说起可以将照片转化为绘画的AI工具,或许你第一个想到的就是多年前一款叫做Prisma的应用程序。

因其“瞬间把照片变成名画”的功能而火爆朋友圈。

也许你还会想到最近流行的迪士尼滤镜,现在在 Snapchat、B 等很多流行的拍照应用中都可以找到它。

作为一名塑料绘画爱好者,每次看到类似 AI 在绘画领域突破的新闻时,Mr. A想尽快尝试一下。

最近讨论的一款二维漫画风格迁移工具AnimeGANv2,再次让我们由衷地感叹技术的力量:只要选择正确的照片,这个工具的成像效果真的可以用“惊艳”来形容。

▲ 图片来自:AnimeGANv2 在线体验页 ▲ 图片来自:AnimeGANv2 在线体验页 AnimeGAN 最初是 GitHub 上的一个开源项目。

自2016年发布以来,引起了很大的讨论,甚至有人在知乎上开帖谈论此事。

其算法模型。

▲ AnimeGAN 的 GitHub 项目 该工具基于一种称为 GAN(名为对抗性生成网络)的技术。

与传统的神经网络模型相比,GAN 是一种新型的无监督架构。

在训练AI时,GAN包括两组独立的网络A和B。

A网络是一个分类器,需要训练来判断图像是否符合标准; B网络是一个生成器,生成与真实样本相似的随机样本,并用它作为假样本来欺骗网络A。

在A和B的对抗中,AI的水平逐渐提高,最终实现质的飞跃。

近日,AnimeGAN 发布了第二代版本。

据称,更新后的AnimeGANv2支持风景照片和风景视频三种动画风格(分别为宫崎骏、新海诚和金珉),视觉效果更好,模型尺寸更小。

更小,更容易训练。

▲ 图片来自:橘吉野的知乎文章,更重要的是,AnimeGANv2 目前的成果已经由社区贡献者开发,并通过 Gradio 实现了一个可以在线运行并发布在 Hugging Face 上的 Demo,换句话说,任何人都可以轻松在线体验AnimeGANv2的效果。

打开相应的网站后,您将看到一个简单的应用程序在线使用布局。

点击虚线框上传本地照片,或者直接将照片拖入框内完成上传操作。

上传完成后,点击下方“提交”按钮,等待几秒即可看到效果。

这个工具本身也提供了大量的样张照片供用户测试。

下拉网页后,点击这些照片,然后滚动到页面顶部即可看到图片已加载。

您可以在图片下方选择不同的效果。

“版本 1”代表改进风格化并降低鲁棒性的设置,而“版本 2”则相反,减少风格化并提高鲁棒性。

简单来说,如果选择版本1,放入的照片会更具漫画特征,但对原照片的还原程度会减弱。

相反,如果选择版本2,则可以生成更真实的渲染效果。

例如,两个不同版本的钢铁侠形象就是一个很好的例子。

AnimeGANv2本身提供了很多名人卡通面孔的成品图供用户欣赏,效果非常好。

我们先从实际体验开始,先从人像开始。

我们首先从免费正版高清图片库Pixabay上找到几张清晰的人像照片(男人、女人和孩子),然后上传到网页上进行计算。

下面是测试效果。

效果还是很好的。

画面中的人物棱角分明,五官分明,绘画感很强。

更难得的是,该应用更准确地捕捉了人物的外貌和特征,具有魅力。

当然,如果没有专门的摄影设备和技巧的帮助,普通人还是很难提供像Pixabay上找到的那样干净清晰的照片,所以A先生也在网上找了几张相对随意的爆头照。

与之前的测试组进行比较。

▲当我看到第三张照片的结果时,我知道这次测试是稳定的。

这次测试的照片都是亚洲人,应该是摄影师的随机自拍照。

AnimeGANv2的计算效果没有让我们失望。

经过测试,发现白色背景的证件照效果最好。

由于肖像权的原因,这里就不公开效果图了。

如果你手头没有合适的照片,不妨直接用证件照来体验一下。

不仅拍照效果好,人物气质捕捉准确,美颜效果突出。

然而,这里有一个美中不足的地方。

不知道是因为AI训练时输入的照片大多是女性照片,还是AI学习提供的漫画图像风格偏向女性化。

当添加一些真实的男性照片时,图像的眼睛就会出现。

会显得有点“少女感”,戴眼镜遮挡可以优化效果。

▲ AnimeGAN 效果 ▲ AnimeGANv2 效果 上面基本使用的是无背景的爆头。

如果我们上传一张带背景的生活照怎么办?虽然整体效果依然可见,但人物的五官瞬间变得模糊起来。

看来,想要获得更好的效果,就得尽量使用半身或者爆头。

另外,在测试过程中发现该应用对于照片质量也有要求。

模糊的头像也会妨碍准确捕捉人的面部特征。

接下来尝试上传一张动物照片,同时从 Pixabay 上获取视频片段。

这次在选择小猫的照片时,我特地选择了一张表情奇怪、脸被遮挡的照片。

没想到,AnimeGANv2依然出色地完成了任务。

我一直以为选择“版本2”会最能还原面部特征和细节,但当我测试小狗的照片时,我发现事实并非如此。

看来根据不同的对象选择合适的款式也很重要。

▲ 小狗版本1和版本2的对比以风景照结束。

虽然知乎中描述 AnimeGANv2 目前支持三种漫画场景风格,但在线版本中并没有可供我们选择的风格选项(该功能可能需要在 GitHub 上以完整代码实现)。

我从Pixabay上选择了北京庄严肃穆的天坛、香港赛博朋克气息的街道、京都清晨静谧的神社,以及两张自然风光照片进行测试。

虽然很难说更像哪位漫画大师的笔迹,但每张成品的效果都让人满意,尤其是香港街拍,艺术感十足,基本上可以放在朋友圈手绘。

名字是假的。

市场上应该有很多类似的将照片转换为绘画风格的应用程序。

就连我们手机中常用的美图秀秀等app也有这样的插件。

为什么 AnimeGAN 团队花了三年多的时间来完善这个工具?细化呢?或许经过这一轮的测试,我们就会得到答案——它的画面自然而美丽,这与其他随处可见但效果相同的画风转换应用不同。

虽然该工具的页面简单,成像时间只有几秒钟,但这几秒钟却包含着复杂的计算和无数的AI练习。

漫画风格转移神器AnimeGAN推出了网络版,它可以在2秒内生成图片,效果媲美专业画家

作为用户,我们很难知道其背后的具体实现,但其惊人的效果所带来的情感体验就是最好的证明。

漫画风格转移神器AnimeGAN推出了网络版,它可以在2秒内生成图片,效果媲美专业画家

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • “失物追踪”专家Tile被收购,曾批评苹果不公平竞争

    “失物追踪”专家Tile被收购,曾批评苹果不公平竞争

    近日,与苹果AirTag竞争的蓝牙追踪器品牌Tile被家庭通信服务商Life以2.05亿美元收购。 该交易预计将于今年第一季度完成。 从双方的定位和产品来看,这是一次互补、各取所需的收购。 Life Location是一款综合性家庭安全应用,提供位置共享、碰撞检测等功能。 其估值已超过10亿

    06-21

  • Strategy Analytics:2020年第四季度需求强劲,全球智能音箱销量突破1.5亿台

    Strategy Analytics:2020年第四季度需求强劲,全球智能音箱销量突破1.5亿台

    Strategy Analytics近期发布的研究报告显示,尽管Covid-19疫情给市场带来挑战,但全球智能音箱销量仍处于领先地位。 2020年智能音箱销量达到1.5亿台,达到历史最高水平,突破1.5亿台。 苹果、亚马逊、谷歌、阿里巴巴和百度的新机型正赶上最重要的圣诞销售季,为艰难的一年画上

    06-18

  • 每秒帧MediaTrack获得数百万美元Pre-A轮融资,由纪源资本领投,

    每秒帧MediaTrack获得数百万美元Pre-A轮融资,由纪源资本领投,

    投资社区(ID:pedaily)1月25日消息,据36氪报道,基于云原生的音视频协作工具平台MediaTrack获得数百万美元Pre-A轮融资。 本轮由纪源资本领投,天使投资人GFC跟投,元和资本参投财务顾问。 通过云原生音视频制作协作工具,分钟帧让创作者、制作者和客户通过云端同步,实现跨

    06-17

  • 心脉医疗今年一季度营收1.97亿元,利润1.02亿元

    心脉医疗今年一季度营收1.97亿元,利润1.02亿元

    科创板上市公司心脉医疗(16.SH)今年一季度实现营收1.97亿元一季度同比增长99.07%;上市公司股东净利润1.02亿元,同比增长70.96%。

    06-18

  • 三星5nm工艺又多了一个客户,谷歌Pixel 6系列有望搭载

    三星5nm工艺又多了一个客户,谷歌Pixel 6系列有望搭载

    知名消费电子爆料达人Jon Prosser近日透露了谷歌新手机Pixel 6系列的部分规格。 它将搭载采用三星5nm工艺的谷歌自研芯片,取代此前使用的高通处理器。 该芯片由谷歌和三星半导体部门联合开发,其性能可与高端Passenger S车型相媲美。 长期以来,一直有传言称谷歌将开发自己的

    06-08

  • GPU分布式通信技术简析——PCle、NVLink、NVSwitch

    GPU分布式通信技术简析——PCle、NVLink、NVSwitch

    本指南深入探讨了GPU分布式通信技术的复杂性,特别是在大规模AI模型时代至关重要的PCIe、NVLink和NVSwitch。 它解决了训练超出单个 GPU 内存限制且必须同时使用多个 GPU 的大型模型的挑战。 该内容重点探讨了数据并行性,这是一种跨多个 GPU 分配数据以并行处理和加速训练的

    06-17

  • QQ浏览器奖励正版小说用户500万,网络文学“正版化”加速

    QQ浏览器奖励正版小说用户500万,网络文学“正版化”加速

    当前,正版网络文学产业建设在阅文集团主导的正版联盟全力推动下快速推进,而各大平台正以积极的态度快速跟进并采取措施打击盗版,为网络文学行业健康快速发展提供助力。 继UC、百度等平台相继斩断“盗版”行动后,QQ浏览器近日推出“小说阅读季”正版文学活动,宣布将投入1万

    06-18

  • 东莞天使基金顺利完成注册

    东莞天使基金顺利完成注册

    投资圈(ID:pedaily)4月25日消息:近日,由东莞市科技局与东莞市科创金融集团共同发起设立的东莞天使基金,在中国基金会协会注册成功完成(备案代码:SAHS99),标志着基金正式启动运营。 3月1日,东莞天使母基金在松山湖隆重启动,来自全国及港澳地区的百余家投资机构代表

    06-18

  • 苹果前高管加盟微软,负责混合现实硬件研究

    苹果前高管加盟微软,负责混合现实硬件研究

    雷锋网注:图片来源LinkedIn 据外媒报道,苹果前高管RubnCaballero已加盟微软,负责混合现实硬件和人工智能技术。 HoloLens混合现实耳机等硬件的研究。 LinkedIn界面显示,Rubn和Caballero已于今年3月加入微软。 在加入微软之前,Rubn在苹果公司工作了14年(2019年1月至2019年

    06-18

  • “深圳深研生物科技”完成超3亿元B+轮融资,越秀产业基金领投

    “深圳深研生物科技”完成超3亿元B+轮融资,越秀产业基金领投

    据投资界(ID:pedaily)2月21日消息,近日,深圳市深研生物科技有限公司完成了超3亿元B+轮融资,越秀产业基金领投。 深圳市深研生物科技有限公司(以下简称“深研生物”)宣布完成超3亿元B+轮融资。 本轮融资由越秀产业基金领投,大辰跟投财智、悦客金融、天士力资本、亚商

    06-17

  • 后PC时代的尴尬:神舟电脑谋求上市,PC厂商谋转型

    后PC时代的尴尬:神舟电脑谋求上市,PC厂商谋转型

    神舟电脑绝对是PC行业的传奇:低价策略席卷PC市场;董事长个人持有90%以上股份;以及愈挫愈勇的四份清单。   据悉,神舟电脑将于9月冲击上交所主板。 此前,神舟电脑曾3次在资本市场失败。 3月22日,神舟电脑第三次上市计划落空。 业内人士分析说,董事长和吴海军的统治是一

    06-18

  • 天上的富贵终于轮到尔滨了,

    天上的富贵终于轮到尔滨了,

    天上的财富终于轮到尔滨了。 往年的寒冬,笼罩着被敲诈印象的东北白雪皑皑的乡村,是游客不敢回避的地方,而三亚则是最爱。 今年,游客的交通由北转向南。 东北老牌网红哈尔滨在元旦假期通过旅游赚了59亿元,已经展现了当年顶级城市的地位。 老哈忙着迎宾、招待客人,而老吉、

    06-18