首页 > 科技未来 > 内容

我们测试了4款网络上流行的“你说我画”自动动画工具,其中一款确实超级强大

发布于:2024-06-21 编辑:匿名 来源:网络

先欣赏一些张美丽场景图。

色彩搭配和谐,构图恰当,富有冲击力。

乍一看,大多数人可能认为它们出自成熟的画家之手。

不过,以上图片实际上取自 YouTuber Quick-Eyed Sky 的 Disco Diffusion 三分钟展示。

视频。

Disco Diffusion是一款通过输入关键词生成图片的AI创作程序。

目前它是 GitHub 上的一个开源项目,任何人都可以玩。

但由于它没有像软件一样进行封装,目前仅在 Google 的 Colaboratory(又称 Colab)中以代码的形式呈现。

近年来,人工智能技术发展迅速。

在艺术创作领域,AI写作、AI绘画、甚至AI编曲都不是什么新鲜事。

随着更加友好的人机交互界面的推广,普通大众现在只需打开开发者提供的网页,只需几步即可体验到AI技术的魅力。

这次我们给大家带来了四款号称可以用嘴画画(输入关键词出草稿)的人工智能创作工具,告诉大家如何使用。

顺便做一下使用方法和绘制效果的对比。

看一看。

哪种AI最容易使用,效果最好。

Disco Diffusion:乙方听话的Disco Diffusion是由艺术家Somnai设计的。

它具有强大的关键字到图像的转换功能,并且由于代码托管在Colab上,因此所有渲染过程都可以在线执行,而不依赖于用户的计算机。

手术。

▲ 创作者的 Twitter ▲ Somnai 使用 Disco Diffusion 制作的视频。

当你第一次打开Disco Diffusion用户界面时,你可能会被大量的代码吓到,但实际上,使用起来非常简单,只要按照以下步骤进行调试即可。

▲ 充满代码的界面很容易让人望而生畏。

我们测试了4款网络上流行的“你说我画”自动动画工具,其中一款确实超级强大

首先,向下拖动网页找到第三项“设置”。

在右侧的“基本设置”中,我们可以设置生成图像的质量。

“步数”是指AI生成的迭代次数。

“Step”值越大,计算时间越长。

然而,艺术在某种程度上是机缘与美的碰撞。

计算的次数越多,作品就越漂亮。

下面的“宽高”是指图像的图像尺寸。

此处只能输入 64 的倍数(例如 , )。

尺寸越大,渲染时间越长。

“设置”中还有一个名为“初始化设置”的部分。

在“init_image”中输入图像的地址,可以让程序根据某个图像进行计算。

点击下图中圈出的部分上传本地图片,然后在列表中选择图片,在右键菜单中找到“复制路径”,复制地址,然后粘贴到“init_image”中。

接下来就是最重要的部分,通过关键词来描述画作的内容。

向下滚动找到“设置”中的“提示”项,然后查看“text_prompts”。

▲ 请勿更改语句中的方括号和引号。

“text_prompts”中代码中的默认语句是: [ Greg rutkowski 和 thomas kinkade 描绘的一座奇异灯塔的美丽画作,其光芒照耀着一片汹涌的血海,在 artstation 上流行。

,黄色配色方案]翻译为:“画家Greg Rutkowski和Thomas kinkade的一部作品,讲述一座在汹涌的血海中闪耀的奇怪灯塔,使用Artstation作为参考库,黄色配色方案。

” “美丽的绘画”是绘画种类,可以将其更改为“水墨画(水墨画)”、“油画(油画)”、“漫画(漫画)”等。

“一座奇异的灯塔,在汹涌的血海中闪耀着光芒”是内容描述,它决定了你的图片中会出现什么内容。

在这里你可以自由的玩耍。

《格雷格·鲁特科斯基和托马斯·金凯德》是这幅画更接近画家的风格。

这里可以输入不止一位画家。

“artstation上的趋势”是绘画的参考平台,即AI主要从哪个平台获取参考。

可以输入的平台包括“Facebook”、“Pixiv”、“Pixbay”等。

“黄色配色”是指整个屏幕的主色调为黄色。

要改变画的内容,只需根据格式调整句子中相应的关键词即可(注意逗号、双引号等必须是英文)。

除了更改关键字之外,您还可以设置每个关键字的权重。

比如我的画家风格是“Van Gogh and Monet(梵高与莫奈)”时,我可以写“Van Gogh:3”和“Monet:2”,即作品像梵高一样是三部分,两部分像莫奈这样的部分。

有时如果我们想让某个元素不出现在屏幕上,我们也可以将该值设置为负数。

▲ 请给我一幅万里无云的天空画,三部分像梵高,两部分像莫奈。

最后我们还可以在第四项“Diffuse!”的“n_batches”中设置一次生成多少张图片。

(变异),即这里输入5的话,最终会得到5张图片(图片越多,耗时越长)。

设置好以上重要参数后,点击页面顶部的“代码执行程序”按钮,在菜单中选择“全部运行”,程序就会开始运行。

免费用户一般分配的是Colaboratory的Tesla K80图形计算机,在线渲染速度比较慢。

一张默认尺寸和迭代次数的图片大约需要一个半到两个小时才能完成。

如果你等不及,也可以选择“连接到本地运行时”并使用计算机的显卡进行渲染,但需要使用“Jupyter Notebook Server”等工具,这里不再讨论。

接下来就是漫长的等待过程。

当您滚动到“扩散!”的底部时您可以看到图片从模糊到逐渐清晰的变化过程。

▲ 程序底部显示运行时间和当前步骤。

根据上一个程序提供的默认语句,我生成了一张海上灯塔的图片。

图片效果一流,用作桌面背景完全没有问题。

接下来,我更改了一些参数并生成了另外两张图片。

描述语句如下:“士郎正宗创作的《机器人天使在夜空中拍打翅膀》的画作,Artstation 热门,蓝色配色方案。

《在夜空中挥舞翅膀的天使》画作,士郎创作Masamune,使用 Artstation 作为参考库,蓝色)” ▲ 默认质量,耗时 1.5 小时 “Cyber??punk station(赛博朋克车站)” ▲ *像素,耗时 45 首先,这两张图片都可以认为是相关的。

《机器天使》画面虽然没有体现“夜空”这个关键词,但构图特色鲜明,天使也能展现出明显的机械感。

至于这幅画是否有士郎正宗的魅力,那就见仁见智了。

在“车站”图片上方我们可以看到火车、电缆和其他元素。

红绿霓虹灯、屏幕等也是典型的赛博朋克元素。

唯一的缺点就是完成度不高。

NightCafe Creator:风格迁移神器 相比Disco Diffusion,NightCafe 好用多了。

NightCafe 的网页提供了两种智能绘图工具。

左边的“Text to Image”是一个类似于Disco Diffusion的工具,用于输入关键字生成图片。

右侧的“风格转移”可以上传用户上传的图片。

照片改为名画风格。

我们先测试第一个函数。

在“您的文字提示”下面的框中输入关键字,例如:被机器包围的城市,然后从下面的 16 种样式中选择一种。

滚动到底部选择纹理优先(Artist)或构图优先(Coherent),点击底部的“CREATE”,等待几分钟,就会生成一个方形图像。

▲ 如果您在图像创建过程中对默认图像尺寸不满意,还可以在关键字输入界面中打开“显示高级选项”。

在此模式下您不仅可以自定义图像的大小,还可以设置多个参考基础图像。

风格转换工具也易于使用。

上传一张照片,从64种著名绘画风格中选择一种,等待1-2分钟,一幅令人惊叹的画面就会诞生。

将之前的灯塔、车站、天使等关键词去掉作者和参考库后输入到NightCafe Creator中,得到如下三张图片。

▲关键词:在汹涌的血海中闪耀的奇异灯塔,黄色。

▲关键词:夜空中挥动翅膀的机械天使画作,蓝色▲关键词:赛博朋克车站的所有画面中,我觉得最好的就是天使的画作,虽然它走的是比较抽象的路线。

但那对类似卫星的太阳能接收翅膀依然体现了机械与天使元素的结合,人物的动作也十分生动。

受到AI的启发,我忍不住根据它画了一幅图。

▲ 我不认为AI能画出有趣的东西。

赛博朋克站的效果相当一般,但灯塔图的效果却很一般。

画面中有很多类似的灯塔,似乎是为了填满画面而被复制了多次。

Cogview:中文关键词,一次八张图片。

Cogview是本次测试中唯一支持中文输入的AI工具(字数限制在2-30个汉字)。

它是由清华大学唐杰团队开发的。

绘图时间为 1-5 一次生成八张图片最多需要 1 分钟,但大小无法调整。

从网页上输入英文关键词会被翻译成中文再计算来看,程序应该是用中文训练的,这在一堆只能输入英文的同类AI中是很少见的。

▲ 该团队去年发表的论文实际上表明,这个程序最擅长的是生成真实照片,而不是艺术画。

例如,当我们输入“大豆制成的字母b”时,AI会给我们八张与描述相符的真实照片。

▲ 经各搜索引擎确认,网络上没有类似图片。

之前的NightCafe Creator无论怎么切换风格都只能制作出类似下图的“艺术作品”。

当关键词与绘画相关时,Cogview 稍显逊色。

例如,当我们想用“油画风格”的风格来生成之前描述的一座塔时,完成的八张图片仍然更像是照片而不是绘画。

赛博朋克车站看起来要好得多,可能是因为它本身就是一座建筑,而且描述也适合现实风格。

重新生成灯塔图像时,我切换到水墨风格,使其更像一幅画。

Cogview是这么多AI中唯一能够真正还原“血海”的AI,不过有点奇怪。

机械天使的油画效果很难一言以蔽之。

所有八幅成品画都过于抽象,难以评估。

不过,据说我们现在习以为常的长着白色翅膀的英俊人形天使形象其实是在文艺复兴时期被美化的。

《旧约》中描述的天使的外貌本来就很奇怪。

毕竟天使是超越人类认知能力的存在。

它们怎么可能和人类长得一样呢? ▲《旧约》中描绘的天使WOMBO Dream:界面精美,作品艺术感十足。

我们在另一篇介绍AI绘画的文章中介绍过这个工具WOMBO Dream。

我想它的界面是这次介绍的界面之一。

它是其中最漂亮的,而且创建图片所需的时间也是其中最短的,大约30秒。

操作过程和NightCafe Creation很相似,这里就不赘述了,上图即可。

▲关键词:夜空中挥动翅膀的机械天使画作,蓝色配色▲关键词:在汹涌的血海中闪耀的奇异灯塔,黄色配色。

▲ 关键词:赛博朋克站 由于程序只支持最多输入英文字母,所以我们不得不删除一些关键词。

从三张图片中我们可以看出,WOMBO Dream的图片追求一种“绘画感”。

所谓“画感”简单来说就是当人们看到它的时候,会认为这件作品是一幅画,而不是像摄影或者3D模型摆拍那样。

当然,程序自带的塔罗牌式相框或许有助于形成“画面感”。

▲ 在图库中右键另存为即可保存无框图片。

下面我们来简单总结一下这四款AI绘图工具。

首先,所有程序都是网络版本,并且可以免费使用。

Disco Diffusion可以实现最复杂的关键词描述,并且有很多自设置的参数。

这是一个巨大的宝库,有待探索,但创建图片需要很长时间,操作界面也相对复杂。

NightCafe Creator和WOMBO Dream都可以快速制作作品。

前者可以设置屏幕大小,也可以容纳更多的关键词,但后者界面更好看,并且自带图片框。

Cogview的优点是支持中文关键词,在生成真实照片方面有优势。

它无法自定义图像尺寸。

在众多AI设计工具流行之后,有人开始担心画家的作品是否会被取代。

《Disco Diffusion》走红后,公众号设计青年实验室邀请了多位设计专家来探讨他们对AI绘画的感受。

其中,插画家疯狂井说:“如果有一天AI取代了更多的价值,那么我会努力寻找新的价值,船自然会到达目的地。

”生产力的发展带来生产方式的变化。

我们都知道,印象派的诞生源于19世纪摄影技术的发明。

当人们意识到无论怎么画都不可能比相机更真实时,朦胧的、个体的、抽象的等等就成了珍贵的东西。

▲莫奈的代表作《日出印象》现在,AI画家的出现再次挑战了我们的艺术世界。

艺术家会用什么策略来捍卫自己的领地?我们不妨拭目以待。

我们测试了4款网络上流行的“你说我画”自动动画工具,其中一款确实超级强大

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 据传,小电科技计划今年在香港上市,最快本月向港交所提交招股说明书,

    据传,小电科技计划今年在香港上市,最快本月向港交所提交招股说明书,

    媒体报道称,小电科技计划今年在香港上市,最快本月将正式向港交所提交招股书。

    06-18

  • 新希望:计划参与设立总规模40亿元的广西新希望生猪供应专项产业基金

    新希望:计划参与设立总规模40亿元的广西新希望生猪供应专项产业基金

    新希望宣布旗下子公司广东基金公司与金橡树公司拟共同设立基金,总规模40亿元与广西引导基金元旗下的广西新希望生猪供应专项产业基金合伙企业(有限合伙)规模40亿元,其中金橡树公司认缴出资32.4亿元,出资比例为81%;广西引导基金认缴出资7.59亿元,出资比例18.%;广东基金

    06-17

  • SEMI:下半年全球晶圆厂设备支出反弹,明年有望强劲增长

    SEMI:下半年全球晶圆厂设备支出反弹,明年有望强劲增长

    新闻SEMI中国,美国加州,2019年12月16日——SEMI在《世界晶圆厂预测》报告中指出( World Fab Forecast)认为,在上半年疲软之后,下半年存储器投资激增,全球晶圆厂设备支出预计将上调至 1 亿美元。 SEMI数据显示,晶圆厂设备投资同比仅下降7%,较之前预测的下降18%有显着改

    06-06

  • OpenAI新法庭文件曝光:马斯克撒谎了!起诉是为了获取专有技术和敏感信息

    OpenAI新法庭文件曝光:马斯克撒谎了!起诉是为了获取专有技术和敏感信息

    马斯克与OpenAI的纠纷有了新进展。 针对马斯克的起诉,OpenAI向法院提交了一份法律文件,请求当地法院根据加州法律对此案作出裁决。 阻止马斯克利用法律程序规则获取OpenAI的技术和商业秘密是一个“复杂的案件”。 在这份长达六页的文件中,OpenAI 强调,他们没有违反与马斯克

    06-17

  • MSCI上调快手ESG评级至BBB

    MSCI上调快手ESG评级至BBB

    近日,国际权威指数机构摩根士丹利资本国际(英文简称“MSCI”)公布了最新年度环境、社会和治理(英文简称“ESG”)评级结果。 凭借在ESG方面的出色管理表现,快手科技(以下简称“快手”)ESG评级提升至BBB级,为国内互联网企业最高级别。 这也是快手自纳入评级以来首次获

    06-18

  • 家居维修公司91昌秀宝完成Pre-A轮融资

    家居维修公司91昌秀宝完成Pre-A轮融资

    据6月24日消息,近日,久易到家(北京)科技有限公司(以下简称:九一到家)运营的91昌秀宝新一轮项目落地。 九一到家)Pre-A轮融资已完成,投资方为北京瑞感鑫盛投资管理中心(有限合伙)。 资本公司投资经理班昱东先生也加入了91长秀宝联合创始人,出任董事一职。 据了解,

    06-18

  • 胡祖六:不要控制VC-PE,互联网不会颠覆传统金融

    胡祖六:不要控制VC-PE,互联网不会颠覆传统金融

    简介:“湘军”、哈佛大学、经济学博士、达沃斯世界经济论坛、IMF官员、经济学家、金融专家、高盛、中国大自然保护协会、春华资本...姚传奇人物明(Fred Hu)始终活跃在国内外各大高端金融论坛和重要经济会议上,像经济学家一样表达对中国经济的看法。   “乡村会被毁掉吗,

    06-17

  • 小鹏汽车已通过港交所上市听证会,第二大股东淘宝持股11.9%

    小鹏汽车已通过港交所上市听证会,第二大股东淘宝持股11.9%

    6月23日,香港联交所官网显示,小鹏汽车已通过香港联合交易所主板听证会。 招股书显示,小鹏汽车的联席保荐人为摩根大通和美银证券,计划发行1万股。 股东方面,招股书显示,小鹏汽车联合创始人、董事长和CEO何小鹏及其关联公司为小鹏汽车控股股东,持股21.75%;淘宝中国持股

    06-18

  • 有吸引力的区块链传媒“商业”,又一“31区”获A轮融资

    有吸引力的区块链传媒“商业”,又一“31区”获A轮融资

    投资界3月19日消息,区块链垂直媒体“31区”近日宣布完成A轮融资,投资方为A-股份上市公司晨鑫科技和区块链投资机构DFUND。   31区于今年2月成立。 它是由中国自媒体公司WeMedia新媒体集团与区块链投资人BMAN联合孵化的区块链传媒。 辰鑫科技是一家A股上市公司,专注于于文

    06-18

  • 广汽集团:5月汽车销量同比增长3.54%

    广汽集团:5月汽车销量同比增长3.54%

    广汽集团公布,5月汽车产量19.24万辆,同比增长16.12%,今年累计产量为91.92万辆,同比增长9.70%; 5月汽车销量 今年总销量18.31万辆,同比增长3.54%。 今年累计销量91.55万辆,同比增长6.40%。

    06-18

  • 布局商业航天产业链,中科星Pre-A轮领投“震旦星康”

    布局商业航天产业链,中科星Pre-A轮领投“震旦星康”

    “震旦星康”于今年8月成立。 是一家定位于航天光通信器件研发的高科技公司。 致力于开发高带宽、高可靠、高安全、低成本的激光通信终端,为用户提供系列产品和系统级解决方案。

    06-18

  • 奈雪茶首日融资暂录367亿港元,超买71倍

    奈雪茶首日融资暂录367亿港元,超买71倍

    6月18日,奈雪茶今日启动IPO。 根据多家券商数据,奈雪的茶暂定融资融券2亿港元,超额认购71.1倍。 其中,辉立贷款1亿港元,富途贷款6000万港元,盈立贷款8.5亿港元。

    06-18