03:一文搞懂稳定扩散扩散去噪原理,玩转AI画画

发布于:2024-10-24 编辑:匿名 来源:网络

前言本来想单独写Noise Predictor的U-Net模型,但是实力还是弱,所以觉得稳定扩散时应与扩散结合使用。只有将概念写在一起,我们才能更好地理解噪声预测器。

因此,这篇文章主要是为了概念扩散而写的,这篇文章与我们使用稳定扩散关系不大。只是让大家了解我们使用稳定扩散时的原理。

扩散(Diffusion) 在稳定扩散的概念中,扩散分为正向扩散(Forward Diffusion)和反向扩散(Forward Diffusion)。下面我们以土生图为例,因为在某种程度上,文生图可以看作是土生图的子集。

前向扩散:前向扩散就像一滴墨水落入一杯水中。墨滴在水中扩散,最终墨滴随机分布在水中。

您无法判断墨滴最初落在杯子的中心还是边缘附近。地方。

在稳定扩散中,输入图像是杯子,噪声是墨滴。在图生图像中,我们需要输入一张图片,通过VAE Encoder将其解码为潜在空间中的4 64 64潜在图像。

前向扩散就是不断给潜像添加噪声,使其变成完全随机的张量,也就是我们所说的噪声图。这里,连续相加是关键词,潜像不会一步变成噪声图像。

从图中可以看出,经过前向扩散后,无法从噪声图片中分辨出原始图片是猫还是狗。但我们的目的是根据输入图像生成相似的图像。

这些已成为噪声图像。如何将它们恢复回来需要前向扩散(Forward Diffusion)。

反向扩散是正向扩散的逆过程。就是将噪声图编程成图片。

正向扩散是指一滴墨滴在水中扩散,然后反向扩散是指我们回到过去,我们会看到墨滴最初添加到的位置。通过反向扩散将噪声图像从随机噪声图像转换为猫/狗图片。

看完图完全不明白反向扩散是如何逆向转换的,那我们来说说如何将噪声图转换成原图?首先,在前向扩散中,稳定扩散逐渐添加噪声,将图片转换为噪声图。然后我们需要知道每一步向该图像添加了多少噪声。

我们一步步从噪声图中减去添加的噪声,最终得到原始图像。如图所示,这是一个步骤去噪的过程。

我们通常将步长设置为20~50。经过多次去噪后,稳定扩散就会生成我们需要的图片。

那么如何知道每一步要减去的噪声呢?稳定扩散中噪声预测器的 U-Net 神经网络模型经过专门训练,可以预测每一步添加的噪声。噪声预测器稳定扩散中的所有模型都将训练噪声预测器。

训练噪声预测器。选择一张训练图像(以猫为例)并生成随机噪声图像。

将噪声图像叠加到不同强度(去噪强度)的训练图像上,以破坏训练图像。教导噪声预测器告诉我们每一步要添加多少噪声。

噪声按顺序添加,噪声预测器估计每一步添加的总噪声。训练后,我们有一个噪声预测器,能够估计添加到图像中的噪声。

如果我们使用别人的大模型,我们根本不需要考虑训练的问题。这些都被封装在大模型中。

使用噪声预测器,我们将图片转换为前向扩散的噪声图。我们从原始噪声图中减去噪声预测器预测的噪声。

重复几个步骤后,我们就会得到一张猫/狗的图片(因为我们猫/狗的图片是用于前向扩散训练的)。但反向扩散之后,我们无法控制最终的图片是生成狗还是猫。

那么这个时候,上一篇文章讨论的条件控制(conditioning)就解决了这个问题。调节是由文本提示转换而来。

我们在文字提示中输入“猫”,或者在否定提示中输入“不是狗”,稳定扩散就会明白你要生成的图片是猫,而不是狗。结构如图所示。

将文本提示转换为条件作为唯一条件,并输入噪声预测器生成图片。图升图中,还有一张图片转换成潜像作为唯一条件,与条件化一起进入Noise预测器。

从图中可以看出,噪声预测器通过文本提示和深度图来预测潜在图像的噪声。 Depth图是通过图中我们通过controlNet输入的图像进行处理得到的。

由于反向扩散后会生成图像,而反向扩散是根据输入图像转换成的噪声图来生成图像的,即需要根据噪声图来生成图像。那么文生图中,这个噪声图是怎么来的。

在文森特图中,稳定扩散直接生成完全随机的噪声图,然后进行反向扩散处理。在稳定扩散中,前向扩散添加的噪声强度由去噪强度决定。

如果去噪强度为 0,则根本不添加任何噪声。如果为1,则图输入的图像将成为完整的Vincent图。

随机噪声图,此时文森图==图生成图像,所以在图生成图像中通常为0.75。我们使用以下文字提示进行测试:ultra high res,1boy,motorcycle,handsome,l,chibi,cute,smile,openmouth,flower,outdoors,music,beret,jacket,blush,tree,:3,shirt,shorthair, Cherryblossoms、greenheadwear、blurry、brownhair、blushstickers、longsleeves、刘海、耳机、blackhair、pinkflower、(beautifuldetailedface)、(beautifuldetailedeyes)、,当去噪强度为0时:文字提示完全没有效果开始并直接按原样输出。

当 Denoising 强度为 0.75 时:结论这篇文章主要讲了 Vincentian 图和图图形中的前向扩散和逆向扩散的理论知识,以及 Noise Predictor 的作用,文中提到的 controlNet 是什么,以及如何转换输入的图像变成深度图,这将在下一篇文章中写。

03:一文搞懂稳定扩散扩散去噪原理,玩转AI画画

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 受Model 3注册量下降影响,一季度特斯拉在加州的汽车注册量同比小幅下降

    受Model 3注册量下降影响,一季度特斯拉在加州的汽车注册量同比小幅下降

    根据市场研究公司Cross-Sell的数据,今年第一季度,特斯拉的汽车注册量加州的增幅略低于去年同期。 下降的主要原因是 Model 3 注册量下降。 数据显示,加州的 Model 3 注册量同比下降 54% 至 7 辆,而 Model Y 紧凑型跨界车的数量为 7 辆。 加州一直是特斯拉在美国市场的领头

    06-18

  • 小马智行获新融资2.67亿美元,估值超53亿美元

    小马智行获新融资2.67亿美元,估值超53亿美元

    投资界消息(微信ID:pedialy),自动驾驶独角兽公司Pony.ai宣布获得安省教师基金资助加拿大退休基金会(OTPP)旗下教师创新平台(TIP)领投C轮融资,总额达2.67亿美元。 本轮投资方还包括Fidelity China Special Situations PLC、五源资本(原晨兴资本)、凯明投资、耀明资本

    06-17

  • 工业互联网服务商“未明智能”获Pre-A+轮融资,4个月内完成两轮融资

    工业互联网服务商“未明智能”获Pre-A+轮融资,4个月内完成两轮融资

    无锡未明智能科技有限公司(以下简称“未明智能”)完成Pre-A+轮融资墨量资本投资的A+轮融资 -A+轮融资。 本轮融资将继续用于产研迭代、业务拓展、人才引进和渠道建设。 7月30日,公司刚刚完成百卡创投领投的Pre-A轮融资。 未名智能成立于2007年,是金属加工领域的工业互联网

    06-18

  • 腾讯再发阳光奖,价值超6万元

    腾讯再发阳光奖,价值超6万元

    从不少腾讯员工处获悉,腾讯今年的阳光奖今天已经揭晓。 每位腾讯员工将获得腾讯股票,提升期为一年。 如果按照当前价格计算,腾讯股票市值约为7.4万港元,折合人民币约6.1万元。 此外,入职不满一年的员工也可以获得此奖项,去年12月加入公司的员工也收到了通知。 (界面)L

    06-18

  • 潮流手表品牌“HappieWatch”获数千万天使轮融资

    潮流手表品牌“HappieWatch”获数千万天使轮融资

    手表及生活潮流品牌“HappieWatch”完成数千万天使轮融资,由德讯投资领投,君尚资本、春妮跟投资本充当专属财务顾问。 本轮融资将用于产品研发、加大品牌建设、渠道拓展等。 听,中小企业反馈平台。 倾听用户的需求,倾听创业者的声音,解决中小企业的痛点。 点击立即参与调

    06-17

  • 东方银星拟成立半导体产业基金投资8英寸MEMS射频产线

    东方银星拟成立半导体产业基金投资8英寸MEMS射频产线

    5月12日,东方银星(53)公告称,为全面加速公司战略转型,公司计划重点关注关于MEMS射频滤波器产业化的方向是成立投资管理公司,打造整合产业资源的投资平台。 公司拟出资1万元投资设立上海兴泰股权投资管理有限公司(名称暂定,具体名称以注册地工商登记机关最终核准为准)

    06-06

  • 【谁说消费不行了·“变强”】AMIRO:今年品牌已进入10亿俱乐部

    【谁说消费不行了·“变强”】AMIRO:今年品牌已进入10亿俱乐部

    编者按“今年消费不行了”简直成为了今年的俗话,人人都可以说吧,大家都在议论。 说“不”的人主要有两个原因:一是资本市场遇冷,二是疫情导致消费市场萎缩。 ——岁末年末,在疫情似乎无休无止的时候,清流资本不得不站出来唱反调:谁说消费不再可以了? !确实,对于大多

    06-18

  • The North Face 和 Balenciaga 都很受欢迎,是全世界男生人必备的

    The North Face 和 Balenciaga 都很受欢迎,是全世界男生人必备的

    最近一张性感孕肚照就获得了1万个点赞,并吸引了6.4万条网友评论。 难道是因为这套Gucci内衣的售价是¥(美元)? ▲ 图片来自:Instagram @chrissyteigen 照片中的辣妈就是曾登上“年度最高片酬模特”榜单的福布斯传奇嫂子 Chrissy Teigen。 两年前,她经历了儿子出生半小时

    06-21

  • 神州数码赴台上市获批并获赛富、IDG投资

    神州数码赴台上市获批并获赛富、IDG投资

    据投资界11月10日消息,神州数码控股有限公司(以下简称“神州数码”)宣布,去年晚间将发行台湾存托凭证(TDR) 台湾TDR的配售架构及发行申请已获台湾中央银行、台湾证券交易所及台湾金融监督管理委员会批准。 至此,神州数码已完成台湾TDR发行的全部审批工作,预计11月24日

    06-17

  • 我的宝城一票投给了东北小镇

    我的宝城一票投给了东北小镇

    最近,黑龙江边陲小城黑河热闹非凡。 9月21日,黑龙江省黑河市恢复中俄团体旅游免签业务。 随后,进出黑河口岸的人数激增。 一手拿着包子,一手拿着啤酒,眼睛盯着即将出炉的鸡蛋汉堡,黑河早市上有很多俄罗斯人。 相关视频也在社交平台上走红。 “俄罗斯人成群结队去黑龙江

    06-18

  • 据悉,英特尔将投资数百亿美元在德国、法国和意大利建厂

    据悉,英特尔将投资数百亿美元在德国、法国和意大利建厂

    北京时间12月23日晚间消息。 据报道,知情人士今天表示,为了增加产能并重新获得技术优势,英特尔计划投资数百亿美元在德国、法国和意大利建设芯片工厂和研发中心。 知情人士称,英特尔将在法国建立一个研究和设计中心,在意大利建立一个测试和组装工厂,在德国建立一个芯片制

    06-08

  • 上海全面推进制造业数字化,参与制定80多项改造标准,

    上海全面推进制造业数字化,参与制定80多项改造标准,

    上头条,上海市委常委、副主席吴清在9月9日的新闻发布会上表示,上海将全面推进城市数字化转型,其中制造业是关键对经济。 数字化转型的重要主线之一。 据悉,为加快全要素生态系统建设,目前已牵头或参与制定80余项制造业数字化转型标准。 《上海市先进制造业发展“十四五”

    06-17