首页 > 科技未来 > 内容

我们测试了4款网络上流行的“你说我画”自动动画工具,其中一款确实超级强大

发布于:2024-06-21 编辑:匿名 来源:网络

先欣赏一些张美丽场景图。

色彩搭配和谐,构图恰当,富有冲击力。

乍一看,大多数人可能认为它们出自成熟的画家之手。

不过,以上图片实际上取自 YouTuber Quick-Eyed Sky 的 Disco Diffusion 三分钟展示。

视频。

Disco Diffusion是一款通过输入关键词生成图片的AI创作程序。

目前它是 GitHub 上的一个开源项目,任何人都可以玩。

但由于它没有像软件一样进行封装,目前仅在 Google 的 Colaboratory(又称 Colab)中以代码的形式呈现。

近年来,人工智能技术发展迅速。

在艺术创作领域,AI写作、AI绘画、甚至AI编曲都不是什么新鲜事。

随着更加友好的人机交互界面的推广,普通大众现在只需打开开发者提供的网页,只需几步即可体验到AI技术的魅力。

这次我们给大家带来了四款号称可以用嘴画画(输入关键词出草稿)的人工智能创作工具,告诉大家如何使用。

顺便做一下使用方法和绘制效果的对比。

看一看。

哪种AI最容易使用,效果最好。

Disco Diffusion:乙方听话的Disco Diffusion是由艺术家Somnai设计的。

它具有强大的关键字到图像的转换功能,并且由于代码托管在Colab上,因此所有渲染过程都可以在线执行,而不依赖于用户的计算机。

手术。

▲ 创作者的 Twitter ▲ Somnai 使用 Disco Diffusion 制作的视频。

当你第一次打开Disco Diffusion用户界面时,你可能会被大量的代码吓到,但实际上,使用起来非常简单,只要按照以下步骤进行调试即可。

▲ 充满代码的界面很容易让人望而生畏。

我们测试了4款网络上流行的“你说我画”自动动画工具,其中一款确实超级强大

首先,向下拖动网页找到第三项“设置”。

在右侧的“基本设置”中,我们可以设置生成图像的质量。

“步数”是指AI生成的迭代次数。

“Step”值越大,计算时间越长。

然而,艺术在某种程度上是机缘与美的碰撞。

计算的次数越多,作品就越漂亮。

下面的“宽高”是指图像的图像尺寸。

此处只能输入 64 的倍数(例如 , )。

尺寸越大,渲染时间越长。

“设置”中还有一个名为“初始化设置”的部分。

在“init_image”中输入图像的地址,可以让程序根据某个图像进行计算。

点击下图中圈出的部分上传本地图片,然后在列表中选择图片,在右键菜单中找到“复制路径”,复制地址,然后粘贴到“init_image”中。

接下来就是最重要的部分,通过关键词来描述画作的内容。

向下滚动找到“设置”中的“提示”项,然后查看“text_prompts”。

▲ 请勿更改语句中的方括号和引号。

“text_prompts”中代码中的默认语句是: [ Greg rutkowski 和 thomas kinkade 描绘的一座奇异灯塔的美丽画作,其光芒照耀着一片汹涌的血海,在 artstation 上流行。

,黄色配色方案]翻译为:“画家Greg Rutkowski和Thomas kinkade的一部作品,讲述一座在汹涌的血海中闪耀的奇怪灯塔,使用Artstation作为参考库,黄色配色方案。

” “美丽的绘画”是绘画种类,可以将其更改为“水墨画(水墨画)”、“油画(油画)”、“漫画(漫画)”等。

“一座奇异的灯塔,在汹涌的血海中闪耀着光芒”是内容描述,它决定了你的图片中会出现什么内容。

在这里你可以自由的玩耍。

《格雷格·鲁特科斯基和托马斯·金凯德》是这幅画更接近画家的风格。

这里可以输入不止一位画家。

“artstation上的趋势”是绘画的参考平台,即AI主要从哪个平台获取参考。

可以输入的平台包括“Facebook”、“Pixiv”、“Pixbay”等。

“黄色配色”是指整个屏幕的主色调为黄色。

要改变画的内容,只需根据格式调整句子中相应的关键词即可(注意逗号、双引号等必须是英文)。

除了更改关键字之外,您还可以设置每个关键字的权重。

比如我的画家风格是“Van Gogh and Monet(梵高与莫奈)”时,我可以写“Van Gogh:3”和“Monet:2”,即作品像梵高一样是三部分,两部分像莫奈这样的部分。

有时如果我们想让某个元素不出现在屏幕上,我们也可以将该值设置为负数。

▲ 请给我一幅万里无云的天空画,三部分像梵高,两部分像莫奈。

最后我们还可以在第四项“Diffuse!”的“n_batches”中设置一次生成多少张图片。

(变异),即这里输入5的话,最终会得到5张图片(图片越多,耗时越长)。

设置好以上重要参数后,点击页面顶部的“代码执行程序”按钮,在菜单中选择“全部运行”,程序就会开始运行。

免费用户一般分配的是Colaboratory的Tesla K80图形计算机,在线渲染速度比较慢。

一张默认尺寸和迭代次数的图片大约需要一个半到两个小时才能完成。

如果你等不及,也可以选择“连接到本地运行时”并使用计算机的显卡进行渲染,但需要使用“Jupyter Notebook Server”等工具,这里不再讨论。

接下来就是漫长的等待过程。

当您滚动到“扩散!”的底部时您可以看到图片从模糊到逐渐清晰的变化过程。

▲ 程序底部显示运行时间和当前步骤。

根据上一个程序提供的默认语句,我生成了一张海上灯塔的图片。

图片效果一流,用作桌面背景完全没有问题。

接下来,我更改了一些参数并生成了另外两张图片。

描述语句如下:“士郎正宗创作的《机器人天使在夜空中拍打翅膀》的画作,Artstation 热门,蓝色配色方案。

《在夜空中挥舞翅膀的天使》画作,士郎创作Masamune,使用 Artstation 作为参考库,蓝色)” ▲ 默认质量,耗时 1.5 小时 “Cyber??punk station(赛博朋克车站)” ▲ *像素,耗时 45 首先,这两张图片都可以认为是相关的。

《机器天使》画面虽然没有体现“夜空”这个关键词,但构图特色鲜明,天使也能展现出明显的机械感。

至于这幅画是否有士郎正宗的魅力,那就见仁见智了。

在“车站”图片上方我们可以看到火车、电缆和其他元素。

红绿霓虹灯、屏幕等也是典型的赛博朋克元素。

唯一的缺点就是完成度不高。

NightCafe Creator:风格迁移神器 相比Disco Diffusion,NightCafe 好用多了。

NightCafe 的网页提供了两种智能绘图工具。

左边的“Text to Image”是一个类似于Disco Diffusion的工具,用于输入关键字生成图片。

右侧的“风格转移”可以上传用户上传的图片。

照片改为名画风格。

我们先测试第一个函数。

在“您的文字提示”下面的框中输入关键字,例如:被机器包围的城市,然后从下面的 16 种样式中选择一种。

滚动到底部选择纹理优先(Artist)或构图优先(Coherent),点击底部的“CREATE”,等待几分钟,就会生成一个方形图像。

▲ 如果您在图像创建过程中对默认图像尺寸不满意,还可以在关键字输入界面中打开“显示高级选项”。

在此模式下您不仅可以自定义图像的大小,还可以设置多个参考基础图像。

风格转换工具也易于使用。

上传一张照片,从64种著名绘画风格中选择一种,等待1-2分钟,一幅令人惊叹的画面就会诞生。

将之前的灯塔、车站、天使等关键词去掉作者和参考库后输入到NightCafe Creator中,得到如下三张图片。

▲关键词:在汹涌的血海中闪耀的奇异灯塔,黄色。

▲关键词:夜空中挥动翅膀的机械天使画作,蓝色▲关键词:赛博朋克车站的所有画面中,我觉得最好的就是天使的画作,虽然它走的是比较抽象的路线。

但那对类似卫星的太阳能接收翅膀依然体现了机械与天使元素的结合,人物的动作也十分生动。

受到AI的启发,我忍不住根据它画了一幅图。

▲ 我不认为AI能画出有趣的东西。

赛博朋克站的效果相当一般,但灯塔图的效果却很一般。

画面中有很多类似的灯塔,似乎是为了填满画面而被复制了多次。

Cogview:中文关键词,一次八张图片。

Cogview是本次测试中唯一支持中文输入的AI工具(字数限制在2-30个汉字)。

它是由清华大学唐杰团队开发的。

绘图时间为 1-5 一次生成八张图片最多需要 1 分钟,但大小无法调整。

从网页上输入英文关键词会被翻译成中文再计算来看,程序应该是用中文训练的,这在一堆只能输入英文的同类AI中是很少见的。

▲ 该团队去年发表的论文实际上表明,这个程序最擅长的是生成真实照片,而不是艺术画。

例如,当我们输入“大豆制成的字母b”时,AI会给我们八张与描述相符的真实照片。

▲ 经各搜索引擎确认,网络上没有类似图片。

之前的NightCafe Creator无论怎么切换风格都只能制作出类似下图的“艺术作品”。

当关键词与绘画相关时,Cogview 稍显逊色。

例如,当我们想用“油画风格”的风格来生成之前描述的一座塔时,完成的八张图片仍然更像是照片而不是绘画。

赛博朋克车站看起来要好得多,可能是因为它本身就是一座建筑,而且描述也适合现实风格。

重新生成灯塔图像时,我切换到水墨风格,使其更像一幅画。

Cogview是这么多AI中唯一能够真正还原“血海”的AI,不过有点奇怪。

机械天使的油画效果很难一言以蔽之。

所有八幅成品画都过于抽象,难以评估。

不过,据说我们现在习以为常的长着白色翅膀的英俊人形天使形象其实是在文艺复兴时期被美化的。

《旧约》中描述的天使的外貌本来就很奇怪。

毕竟天使是超越人类认知能力的存在。

它们怎么可能和人类长得一样呢? ▲《旧约》中描绘的天使WOMBO Dream:界面精美,作品艺术感十足。

我们在另一篇介绍AI绘画的文章中介绍过这个工具WOMBO Dream。

我想它的界面是这次介绍的界面之一。

它是其中最漂亮的,而且创建图片所需的时间也是其中最短的,大约30秒。

操作过程和NightCafe Creation很相似,这里就不赘述了,上图即可。

▲关键词:夜空中挥动翅膀的机械天使画作,蓝色配色▲关键词:在汹涌的血海中闪耀的奇异灯塔,黄色配色。

▲ 关键词:赛博朋克站 由于程序只支持最多输入英文字母,所以我们不得不删除一些关键词。

从三张图片中我们可以看出,WOMBO Dream的图片追求一种“绘画感”。

所谓“画感”简单来说就是当人们看到它的时候,会认为这件作品是一幅画,而不是像摄影或者3D模型摆拍那样。

当然,程序自带的塔罗牌式相框或许有助于形成“画面感”。

▲ 在图库中右键另存为即可保存无框图片。

下面我们来简单总结一下这四款AI绘图工具。

首先,所有程序都是网络版本,并且可以免费使用。

Disco Diffusion可以实现最复杂的关键词描述,并且有很多自设置的参数。

这是一个巨大的宝库,有待探索,但创建图片需要很长时间,操作界面也相对复杂。

NightCafe Creator和WOMBO Dream都可以快速制作作品。

前者可以设置屏幕大小,也可以容纳更多的关键词,但后者界面更好看,并且自带图片框。

Cogview的优点是支持中文关键词,在生成真实照片方面有优势。

它无法自定义图像尺寸。

在众多AI设计工具流行之后,有人开始担心画家的作品是否会被取代。

《Disco Diffusion》走红后,公众号设计青年实验室邀请了多位设计专家来探讨他们对AI绘画的感受。

其中,插画家疯狂井说:“如果有一天AI取代了更多的价值,那么我会努力寻找新的价值,船自然会到达目的地。

”生产力的发展带来生产方式的变化。

我们都知道,印象派的诞生源于19世纪摄影技术的发明。

当人们意识到无论怎么画都不可能比相机更真实时,朦胧的、个体的、抽象的等等就成了珍贵的东西。

▲莫奈的代表作《日出印象》现在,AI画家的出现再次挑战了我们的艺术世界。

艺术家会用什么策略来捍卫自己的领地?我们不妨拭目以待。

我们测试了4款网络上流行的“你说我画”自动动画工具,其中一款确实超级强大

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • Groupon IPO变数陡增:涉嫌违反相关规定

    Groupon IPO变数陡增:涉嫌违反相关规定

    简介:MarketWatch专栏作家普莱蒂(Therese Poletti)撰文称,团购网站Groupon已经踏上了万众期待的IPO之路,但该公司却然而在这个过程中却发生了一系列离奇的事情,更加涉嫌违反相关规定。 这无疑给他们本已存疑的未来增添了更多的变数。   以下为普莱蒂解说全文:   团

    06-17

  • 终于又一家PE公司巨头即将上市

    终于又一家PE公司巨头即将上市

    海外PE上市潮来了。 最新消息称,TPG已聘请摩根大通和高盛协助其准备IPO,并计划在未来几周秘密向监管机构提交申请,估值可能达到1亿美元。 TPG成立于2007年,是全球最大的私募股权投资公司之一。 如今,其管理规模已超过1亿美元。 中国最近最轰动的投资是叮当快药。 TPG并不

    06-18

  • 悦唯医疗完成近亿元A+轮融资,清科资本担任本轮融资独家财务顾问

    悦唯医疗完成近亿元A+轮融资,清科资本担任本轮融资独家财务顾问

    耀明医疗完成近亿元A+轮融资,清科资本独家代理本轮融资。 据投资界(ID:pedaily)12月28日消息,耀明医疗近日宣布完成近亿元A+轮融资。 本轮融资由诺域资本领投,启辰控股、中南创投基金跟投。 老股东IDG资本、源慧创益继续投资。 清科创投(.HK)旗下清科资本担任本轮融资

    06-18

  • Transphorm 的第三代 GaN 功率转换平台提高了抗干扰性并降低了开关噪声

    Transphorm 的第三代 GaN 功率转换平台提高了抗干扰性并降低了开关噪声

    美国商业资讯 - Transphorm Inc. 今天宣布,在设计和制造业界最高可靠性且首款符合 JEDEC 和 AEC-Q 的氮化镓 (GaN) 半导体方面处于领先地位推出第三代 (Gen III) 伏 (V) GaN FET。 采用第三代技术的功率晶体可以降低电磁干扰(EMI),提高栅极噪声抑制能力,并在电路应用中提

    06-06

  • 君实生物等5家科创板A+H股公司纳入港股通

    君实生物等5家科创板A+H股公司纳入港股通

    据统计,科创板A+H股公司共有5家创新板包括通号、君实生物、复旦张江、康熙诺、普廷科。 这意味着这五家公司的A股将纳入沪股通,H股将纳入港股通。

    06-18

  • 华映资本第六期人民币成长基金募资超21.2亿元

    华映资本第六期人民币成长基金募资超21.2亿元

    据投资界(ID:pedaily)5月20日消息,华映资本宣布关闭第六期人民币成长基金,该基金超募规模达21.2亿元。 从第一次通过到最终关闭,历时4个月。 其中,原投资者再投资率达到45.7%;加上今年早些时候设立的、即将竣工的天使基金和产业基金,华映今年新募集的人民币基金超过

    06-17

  • 东方精选正在招聘TikTok运营商,月薪2万起

    东方精选正在招聘TikTok运营商,月薪2万起

    东方精选的出海路径逐渐清晰。 1月5日,时代周报记者从招聘网站猎聘获悉,东方精选近期启动相关岗位招聘,包括内容运营经理、商务经理、运营经理以及TikTok海外店运营等,月薪在2万元至4万元不等。 元。 万元之间。 TikTok是字节跳动面向海外市场的视频社交平台。 东方精选推

    06-17

  • 搜狗同声传译3.0:引入视觉能力+知识图谱,打造语境引擎

    搜狗同声传译3.0:引入视觉能力+知识图谱,打造语境引擎

    李世石与AlphGO的“人机大战”已经过去三年了。 似乎没有人再怀疑“下棋”人类确实输给了人工智能。 人类与人工智能的下一场战斗将在哪里?同声传译(同声传译)将很可能是下一个具有挑战性的应用场景。 12月21日,基于上下文引擎的搜狗同声传译3.0以多模态和自主学习为核心

    06-18

  • 智能科技完成近亿元B轮融资,长江创新

    智能科技完成近亿元B轮融资,长江创新

    领投 投资界(ID:pedaily)消息,智能科技(Chemical.AI)宣布10月完成长江创新领投的A轮投资创新,以钧山私募为后续投资方的B轮融资,融资金额近亿元。 本轮融资将用于推动智能科技(Chemical.AI)在AI制药赛道的发展,加快智能科技逆合成平台技术和自动化技术的创新速度,

    06-17

  • 肖特完整的激光雷达解决方案加速自动驾驶进程

    肖特完整的激光雷达解决方案加速自动驾驶进程

    随着自动驾驶L3量产的临近,能够接收高精度信号的激光雷达变得越来越重要。 对于激光雷达技术的迭代更新,特种玻璃和气密包装发挥着关键作用。 提供相关解决方案的肖特公司目前可以提供防护窗、光路组件、气密包装等一站式产品采购。 其中,肖特特种玻璃可以承受各种天气条件

    06-17

  • 【创业24小时】2022年10月14日

    【创业24小时】2022年10月14日

    2022年10月14日行业大公司88VIP等待携手腾讯视频。 点击查看抖音对传统电商的挑战已延伸至“9元9”领域。 点击查看腾讯诉OPPO:一场持久战。 点击查看支持这条“闲鱼”。 点击查看左侧为Byte,右侧为Meta。 国内外各大厂商的VR布局各有不同。 点击查看美团“开超市”结局,想

    06-18

  • 联想再次回应“前高管常程退出小米”:常程不承认其签名真实性

    联想再次回应“前高管常程退出小米”:常程不承认其签名真实性

    9月17日上头条,关于“前联想手机业务负责人常程违反竞业禁止义务”的“争议”,??联想集团再次回应称,竞业禁止协议已确认由其签署。 联想表示,该案已在北京市海淀区劳动人事争议仲裁委员会多次开庭审理。 “由于常程不承认其签名的真实性,仲裁委员会委托法院科技鉴定所对

    06-17