Groupon IPO变数陡增:涉嫌违反相关规定
06-17
先欣赏一些张美丽场景图。
色彩搭配和谐,构图恰当,富有冲击力。
乍一看,大多数人可能认为它们出自成熟的画家之手。
不过,以上图片实际上取自 YouTuber Quick-Eyed Sky 的 Disco Diffusion 三分钟展示。
视频。
Disco Diffusion是一款通过输入关键词生成图片的AI创作程序。
目前它是 GitHub 上的一个开源项目,任何人都可以玩。
但由于它没有像软件一样进行封装,目前仅在 Google 的 Colaboratory(又称 Colab)中以代码的形式呈现。
近年来,人工智能技术发展迅速。
在艺术创作领域,AI写作、AI绘画、甚至AI编曲都不是什么新鲜事。
随着更加友好的人机交互界面的推广,普通大众现在只需打开开发者提供的网页,只需几步即可体验到AI技术的魅力。
这次我们给大家带来了四款号称可以用嘴画画(输入关键词出草稿)的人工智能创作工具,告诉大家如何使用。
顺便做一下使用方法和绘制效果的对比。
看一看。
哪种AI最容易使用,效果最好。
Disco Diffusion:乙方听话的Disco Diffusion是由艺术家Somnai设计的。
它具有强大的关键字到图像的转换功能,并且由于代码托管在Colab上,因此所有渲染过程都可以在线执行,而不依赖于用户的计算机。
手术。
▲ 创作者的 Twitter ▲ Somnai 使用 Disco Diffusion 制作的视频。
当你第一次打开Disco Diffusion用户界面时,你可能会被大量的代码吓到,但实际上,使用起来非常简单,只要按照以下步骤进行调试即可。
▲ 充满代码的界面很容易让人望而生畏。

首先,向下拖动网页找到第三项“设置”。
在右侧的“基本设置”中,我们可以设置生成图像的质量。
“步数”是指AI生成的迭代次数。
“Step”值越大,计算时间越长。
然而,艺术在某种程度上是机缘与美的碰撞。
计算的次数越多,作品就越漂亮。
下面的“宽高”是指图像的图像尺寸。
此处只能输入 64 的倍数(例如 , )。
尺寸越大,渲染时间越长。
“设置”中还有一个名为“初始化设置”的部分。
在“init_image”中输入图像的地址,可以让程序根据某个图像进行计算。
点击下图中圈出的部分上传本地图片,然后在列表中选择图片,在右键菜单中找到“复制路径”,复制地址,然后粘贴到“init_image”中。
接下来就是最重要的部分,通过关键词来描述画作的内容。
向下滚动找到“设置”中的“提示”项,然后查看“text_prompts”。
▲ 请勿更改语句中的方括号和引号。
“text_prompts”中代码中的默认语句是: [ Greg rutkowski 和 thomas kinkade 描绘的一座奇异灯塔的美丽画作,其光芒照耀着一片汹涌的血海,在 artstation 上流行。
,黄色配色方案]翻译为:“画家Greg Rutkowski和Thomas kinkade的一部作品,讲述一座在汹涌的血海中闪耀的奇怪灯塔,使用Artstation作为参考库,黄色配色方案。
” “美丽的绘画”是绘画种类,可以将其更改为“水墨画(水墨画)”、“油画(油画)”、“漫画(漫画)”等。
“一座奇异的灯塔,在汹涌的血海中闪耀着光芒”是内容描述,它决定了你的图片中会出现什么内容。
在这里你可以自由的玩耍。
《格雷格·鲁特科斯基和托马斯·金凯德》是这幅画更接近画家的风格。
这里可以输入不止一位画家。
“artstation上的趋势”是绘画的参考平台,即AI主要从哪个平台获取参考。
可以输入的平台包括“Facebook”、“Pixiv”、“Pixbay”等。
“黄色配色”是指整个屏幕的主色调为黄色。
要改变画的内容,只需根据格式调整句子中相应的关键词即可(注意逗号、双引号等必须是英文)。
除了更改关键字之外,您还可以设置每个关键字的权重。
比如我的画家风格是“Van Gogh and Monet(梵高与莫奈)”时,我可以写“Van Gogh:3”和“Monet:2”,即作品像梵高一样是三部分,两部分像莫奈这样的部分。
有时如果我们想让某个元素不出现在屏幕上,我们也可以将该值设置为负数。
▲ 请给我一幅万里无云的天空画,三部分像梵高,两部分像莫奈。
最后我们还可以在第四项“Diffuse!”的“n_batches”中设置一次生成多少张图片。
(变异),即这里输入5的话,最终会得到5张图片(图片越多,耗时越长)。
设置好以上重要参数后,点击页面顶部的“代码执行程序”按钮,在菜单中选择“全部运行”,程序就会开始运行。
免费用户一般分配的是Colaboratory的Tesla K80图形计算机,在线渲染速度比较慢。
一张默认尺寸和迭代次数的图片大约需要一个半到两个小时才能完成。
如果你等不及,也可以选择“连接到本地运行时”并使用计算机的显卡进行渲染,但需要使用“Jupyter Notebook Server”等工具,这里不再讨论。
接下来就是漫长的等待过程。
当您滚动到“扩散!”的底部时您可以看到图片从模糊到逐渐清晰的变化过程。
▲ 程序底部显示运行时间和当前步骤。
根据上一个程序提供的默认语句,我生成了一张海上灯塔的图片。
图片效果一流,用作桌面背景完全没有问题。
接下来,我更改了一些参数并生成了另外两张图片。
描述语句如下:“士郎正宗创作的《机器人天使在夜空中拍打翅膀》的画作,Artstation 热门,蓝色配色方案。
《在夜空中挥舞翅膀的天使》画作,士郎创作Masamune,使用 Artstation 作为参考库,蓝色)” ▲ 默认质量,耗时 1.5 小时 “Cyber??punk station(赛博朋克车站)” ▲ *像素,耗时 45 首先,这两张图片都可以认为是相关的。
《机器天使》画面虽然没有体现“夜空”这个关键词,但构图特色鲜明,天使也能展现出明显的机械感。
至于这幅画是否有士郎正宗的魅力,那就见仁见智了。
在“车站”图片上方我们可以看到火车、电缆和其他元素。
红绿霓虹灯、屏幕等也是典型的赛博朋克元素。
唯一的缺点就是完成度不高。
NightCafe Creator:风格迁移神器 相比Disco Diffusion,NightCafe 好用多了。
NightCafe 的网页提供了两种智能绘图工具。
左边的“Text to Image”是一个类似于Disco Diffusion的工具,用于输入关键字生成图片。
右侧的“风格转移”可以上传用户上传的图片。
照片改为名画风格。
我们先测试第一个函数。
在“您的文字提示”下面的框中输入关键字,例如:被机器包围的城市,然后从下面的 16 种样式中选择一种。
滚动到底部选择纹理优先(Artist)或构图优先(Coherent),点击底部的“CREATE”,等待几分钟,就会生成一个方形图像。
▲ 如果您在图像创建过程中对默认图像尺寸不满意,还可以在关键字输入界面中打开“显示高级选项”。
在此模式下您不仅可以自定义图像的大小,还可以设置多个参考基础图像。
风格转换工具也易于使用。
上传一张照片,从64种著名绘画风格中选择一种,等待1-2分钟,一幅令人惊叹的画面就会诞生。
将之前的灯塔、车站、天使等关键词去掉作者和参考库后输入到NightCafe Creator中,得到如下三张图片。
▲关键词:在汹涌的血海中闪耀的奇异灯塔,黄色。
▲关键词:夜空中挥动翅膀的机械天使画作,蓝色▲关键词:赛博朋克车站的所有画面中,我觉得最好的就是天使的画作,虽然它走的是比较抽象的路线。
但那对类似卫星的太阳能接收翅膀依然体现了机械与天使元素的结合,人物的动作也十分生动。
受到AI的启发,我忍不住根据它画了一幅图。
▲ 我不认为AI能画出有趣的东西。
赛博朋克站的效果相当一般,但灯塔图的效果却很一般。
画面中有很多类似的灯塔,似乎是为了填满画面而被复制了多次。
Cogview:中文关键词,一次八张图片。
Cogview是本次测试中唯一支持中文输入的AI工具(字数限制在2-30个汉字)。
它是由清华大学唐杰团队开发的。
绘图时间为 1-5 一次生成八张图片最多需要 1 分钟,但大小无法调整。
从网页上输入英文关键词会被翻译成中文再计算来看,程序应该是用中文训练的,这在一堆只能输入英文的同类AI中是很少见的。
▲ 该团队去年发表的论文实际上表明,这个程序最擅长的是生成真实照片,而不是艺术画。
例如,当我们输入“大豆制成的字母b”时,AI会给我们八张与描述相符的真实照片。
▲ 经各搜索引擎确认,网络上没有类似图片。
之前的NightCafe Creator无论怎么切换风格都只能制作出类似下图的“艺术作品”。
当关键词与绘画相关时,Cogview 稍显逊色。
例如,当我们想用“油画风格”的风格来生成之前描述的一座塔时,完成的八张图片仍然更像是照片而不是绘画。
赛博朋克车站看起来要好得多,可能是因为它本身就是一座建筑,而且描述也适合现实风格。
重新生成灯塔图像时,我切换到水墨风格,使其更像一幅画。
Cogview是这么多AI中唯一能够真正还原“血海”的AI,不过有点奇怪。
机械天使的油画效果很难一言以蔽之。
所有八幅成品画都过于抽象,难以评估。
不过,据说我们现在习以为常的长着白色翅膀的英俊人形天使形象其实是在文艺复兴时期被美化的。
《旧约》中描述的天使的外貌本来就很奇怪。
毕竟天使是超越人类认知能力的存在。
它们怎么可能和人类长得一样呢? ▲《旧约》中描绘的天使WOMBO Dream:界面精美,作品艺术感十足。
我们在另一篇介绍AI绘画的文章中介绍过这个工具WOMBO Dream。
我想它的界面是这次介绍的界面之一。
它是其中最漂亮的,而且创建图片所需的时间也是其中最短的,大约30秒。
操作过程和NightCafe Creation很相似,这里就不赘述了,上图即可。
▲关键词:夜空中挥动翅膀的机械天使画作,蓝色配色▲关键词:在汹涌的血海中闪耀的奇异灯塔,黄色配色。
▲ 关键词:赛博朋克站 由于程序只支持最多输入英文字母,所以我们不得不删除一些关键词。
从三张图片中我们可以看出,WOMBO Dream的图片追求一种“绘画感”。
所谓“画感”简单来说就是当人们看到它的时候,会认为这件作品是一幅画,而不是像摄影或者3D模型摆拍那样。
当然,程序自带的塔罗牌式相框或许有助于形成“画面感”。
▲ 在图库中右键另存为即可保存无框图片。
下面我们来简单总结一下这四款AI绘图工具。
首先,所有程序都是网络版本,并且可以免费使用。
Disco Diffusion可以实现最复杂的关键词描述,并且有很多自设置的参数。
这是一个巨大的宝库,有待探索,但创建图片需要很长时间,操作界面也相对复杂。
NightCafe Creator和WOMBO Dream都可以快速制作作品。
前者可以设置屏幕大小,也可以容纳更多的关键词,但后者界面更好看,并且自带图片框。
Cogview的优点是支持中文关键词,在生成真实照片方面有优势。
它无法自定义图像尺寸。
在众多AI设计工具流行之后,有人开始担心画家的作品是否会被取代。
《Disco Diffusion》走红后,公众号设计青年实验室邀请了多位设计专家来探讨他们对AI绘画的感受。
其中,插画家疯狂井说:“如果有一天AI取代了更多的价值,那么我会努力寻找新的价值,船自然会到达目的地。
”生产力的发展带来生产方式的变化。
我们都知道,印象派的诞生源于19世纪摄影技术的发明。
当人们意识到无论怎么画都不可能比相机更真实时,朦胧的、个体的、抽象的等等就成了珍贵的东西。
▲莫奈的代表作《日出印象》现在,AI画家的出现再次挑战了我们的艺术世界。
艺术家会用什么策略来捍卫自己的领地?我们不妨拭目以待。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-18
06-17
06-17
06-17
06-17
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态