首页 > 网络技术迭代 > 内容

03：一文搞懂稳定扩散扩散去噪原理，玩转AI画画

发布于：2024-10-24 编辑：匿名来源：网络

前言本来想单独写Noise Predictor的U-Net模型，但是实力还是弱，所以觉得稳定扩散时应与扩散结合使用。只有将概念写在一起，我们才能更好地理解噪声预测器。

因此，这篇文章主要是为了概念扩散而写的，这篇文章与我们使用稳定扩散关系不大。只是让大家了解我们使用稳定扩散时的原理。

扩散（Diffusion）在稳定扩散的概念中，扩散分为正向扩散（Forward Diffusion）和反向扩散（Forward Diffusion）。下面我们以土生图为例，因为在某种程度上，文生图可以看作是土生图的子集。

前向扩散：前向扩散就像一滴墨水落入一杯水中。墨滴在水中扩散，最终墨滴随机分布在水中。

您无法判断墨滴最初落在杯子的中心还是边缘附近。地方。

在稳定扩散中，输入图像是杯子，噪声是墨滴。在图生图像中，我们需要输入一张图片，通过VAE Encoder将其解码为潜在空间中的4 64 64潜在图像。

前向扩散就是不断给潜像添加噪声，使其变成完全随机的张量，也就是我们所说的噪声图。这里，连续相加是关键词，潜像不会一步变成噪声图像。

从图中可以看出，经过前向扩散后，无法从噪声图片中分辨出原始图片是猫还是狗。但我们的目的是根据输入图像生成相似的图像。

这些已成为噪声图像。如何将它们恢复回来需要前向扩散（Forward Diffusion）。

反向扩散是正向扩散的逆过程。就是将噪声图编程成图片。

正向扩散是指一滴墨滴在水中扩散，然后反向扩散是指我们回到过去，我们会看到墨滴最初添加到的位置。通过反向扩散将噪声图像从随机噪声图像转换为猫/狗图片。

看完图完全不明白反向扩散是如何逆向转换的，那我们来说说如何将噪声图转换成原图？首先，在前向扩散中，稳定扩散逐渐添加噪声，将图片转换为噪声图。然后我们需要知道每一步向该图像添加了多少噪声。

我们一步步从噪声图中减去添加的噪声，最终得到原始图像。如图所示，这是一个步骤去噪的过程。

我们通常将步长设置为20~50。经过多次去噪后，稳定扩散就会生成我们需要的图片。

那么如何知道每一步要减去的噪声呢？稳定扩散中噪声预测器的 U-Net 神经网络模型经过专门训练，可以预测每一步添加的噪声。噪声预测器稳定扩散中的所有模型都将训练噪声预测器。

训练噪声预测器。选择一张训练图像（以猫为例）并生成随机噪声图像。

将噪声图像叠加到不同强度（去噪强度）的训练图像上，以破坏训练图像。教导噪声预测器告诉我们每一步要添加多少噪声。

噪声按顺序添加，噪声预测器估计每一步添加的总噪声。训练后，我们有一个噪声预测器，能够估计添加到图像中的噪声。

如果我们使用别人的大模型，我们根本不需要考虑训练的问题。这些都被封装在大模型中。

使用噪声预测器，我们将图片转换为前向扩散的噪声图。我们从原始噪声图中减去噪声预测器预测的噪声。

重复几个步骤后，我们就会得到一张猫/狗的图片（因为我们猫/狗的图片是用于前向扩散训练的）。但反向扩散之后，我们无法控制最终的图片是生成狗还是猫。

那么这个时候，上一篇文章讨论的条件控制（conditioning）就解决了这个问题。调节是由文本提示转换而来。

我们在文字提示中输入“猫”，或者在否定提示中输入“不是狗”，稳定扩散就会明白你要生成的图片是猫，而不是狗。结构如图所示。

将文本提示转换为条件作为唯一条件，并输入噪声预测器生成图片。图升图中，还有一张图片转换成潜像作为唯一条件，与条件化一起进入Noise预测器。

从图中可以看出，噪声预测器通过文本提示和深度图来预测潜在图像的噪声。 Depth图是通过图中我们通过controlNet输入的图像进行处理得到的。

由于反向扩散后会生成图像，而反向扩散是根据输入图像转换成的噪声图来生成图像的，即需要根据噪声图来生成图像。那么文生图中，这个噪声图是怎么来的。

在文森特图中，稳定扩散直接生成完全随机的噪声图，然后进行反向扩散处理。在稳定扩散中，前向扩散添加的噪声强度由去噪强度决定。

如果去噪强度为 0，则根本不添加任何噪声。如果为1，则图输入的图像将成为完整的Vincent图。

随机噪声图，此时文森图==图生成图像，所以在图生成图像中通常为0.75。我们使用以下文字提示进行测试：ultra high res,1boy,motorcycle,handsome,l,chibi,cute,smile,openmouth,flower,outdoors,music,beret,jacket,blush,tree,:3,shirt,shorthair, Cherryblossoms、greenheadwear、blurry、brownhair、blushstickers、longsleeves、刘海、耳机、blackhair、pinkflower、(beautifuldetailedface)、(beautifuldetailedeyes)、，当去噪强度为0时：文字提示完全没有效果开始并直接按原样输出。

当 Denoising 强度为 0.75 时：结论这篇文章主要讲了 Vincentian 图和图图形中的前向扩散和逆向扩散的理论知识，以及 Noise Predictor 的作用，文中提到的 controlNet 是什么，以及如何转换输入的图像变成深度图，这将在下一篇文章中写。

站长声明

标签：

上一篇：如何使用 S3CMD 访问 COS 服务

下一篇：在通过this引用的自定义控件中添加Vue中的类型声明，$refs

受Model 3注册量下降影响，一季度特斯拉在加州的汽车注册量同比小幅下降

根据市场研究公司Cross-Sell的数据，今年第一季度，特斯拉的汽车注册量加州的增幅略低于去年同期。下降的主要原因是 Model 3 注册量下降。数据显示，加州的 Model 3 注册量同比下降 54% 至 7 辆，而 Model Y 紧凑型跨界车的数量为 7 辆。加州一直是特斯拉在美国市场的领头

06-18
小马智行获新融资2.67亿美元，估值超53亿美元

投资界消息（微信ID：pedialy），自动驾驶独角兽公司Pony.ai宣布获得安省教师基金资助加拿大退休基金会（OTPP）旗下教师创新平台（TIP）领投C轮融资，总额达2.67亿美元。本轮投资方还包括Fidelity China Special Situations PLC、五源资本（原晨兴资本）、凯明投资、耀明资本

06-17
工业互联网服务商“未明智能”获Pre-A+轮融资，4个月内完成两轮融资

无锡未明智能科技有限公司（以下简称“未明智能”）完成Pre-A+轮融资墨量资本投资的A+轮融资 -A+轮融资。本轮融资将继续用于产研迭代、业务拓展、人才引进和渠道建设。 7月30日，公司刚刚完成百卡创投领投的Pre-A轮融资。未名智能成立于2007年，是金属加工领域的工业互联网

06-18
腾讯再发阳光奖，价值超6万元

从不少腾讯员工处获悉，腾讯今年的阳光奖今天已经揭晓。每位腾讯员工将获得腾讯股票，提升期为一年。如果按照当前价格计算，腾讯股票市值约为7.4万港元，折合人民币约6.1万元。此外，入职不满一年的员工也可以获得此奖项，去年12月加入公司的员工也收到了通知。（界面）L

06-18
潮流手表品牌“HappieWatch”获数千万天使轮融资

手表及生活潮流品牌“HappieWatch”完成数千万天使轮融资，由德讯投资领投，君尚资本、春妮跟投资本充当专属财务顾问。本轮融资将用于产品研发、加大品牌建设、渠道拓展等。听，中小企业反馈平台。倾听用户的需求，倾听创业者的声音，解决中小企业的痛点。点击立即参与调

06-17
东方银星拟成立半导体产业基金投资8英寸MEMS射频产线

5月12日，东方银星（53）公告称，为全面加速公司战略转型，公司计划重点关注关于MEMS射频滤波器产业化的方向是成立投资管理公司，打造整合产业资源的投资平台。公司拟出资1万元投资设立上海兴泰股权投资管理有限公司（名称暂定，具体名称以注册地工商登记机关最终核准为准）

06-06
【谁说消费不行了·“变强”】AMIRO：今年品牌已进入10亿俱乐部

编者按“今年消费不行了”简直成为了今年的俗话，人人都可以说吧，大家都在议论。说“不”的人主要有两个原因：一是资本市场遇冷，二是疫情导致消费市场萎缩。 ——岁末年末，在疫情似乎无休无止的时候，清流资本不得不站出来唱反调：谁说消费不再可以了？！确实，对于大多

06-18
The North Face 和 Balenciaga 都很受欢迎，是全世界男生人必备的

最近一张性感孕肚照就获得了1万个点赞，并吸引了6.4万条网友评论。难道是因为这套Gucci内衣的售价是￥（美元）？ ▲ 图片来自：Instagram @chrissyteigen 照片中的辣妈就是曾登上“年度最高片酬模特”榜单的福布斯传奇嫂子 Chrissy Teigen。两年前，她经历了儿子出生半小时

06-21
神州数码赴台上市获批并获赛富、IDG投资

据投资界11月10日消息，神州数码控股有限公司（以下简称“神州数码”）宣布，去年晚间将发行台湾存托凭证（TDR）台湾TDR的配售架构及发行申请已获台湾中央银行、台湾证券交易所及台湾金融监督管理委员会批准。至此，神州数码已完成台湾TDR发行的全部审批工作，预计11月24日

06-17
我的宝城一票投给了东北小镇

最近，黑龙江边陲小城黑河热闹非凡。 9月21日，黑龙江省黑河市恢复中俄团体旅游免签业务。随后，进出黑河口岸的人数激增。一手拿着包子，一手拿着啤酒，眼睛盯着即将出炉的鸡蛋汉堡，黑河早市上有很多俄罗斯人。相关视频也在社交平台上走红。 “俄罗斯人成群结队去黑龙江

06-18
据悉，英特尔将投资数百亿美元在德国、法国和意大利建厂

北京时间12月23日晚间消息。据报道，知情人士今天表示，为了增加产能并重新获得技术优势，英特尔计划投资数百亿美元在德国、法国和意大利建设芯片工厂和研发中心。知情人士称，英特尔将在法国建立一个研究和设计中心，在意大利建立一个测试和组装工厂，在德国建立一个芯片制

06-08
上海全面推进制造业数字化，参与制定80多项改造标准，

上头条，上海市委常委、副主席吴清在9月9日的新闻发布会上表示，上海将全面推进城市数字化转型，其中制造业是关键对经济。数字化转型的重要主线之一。据悉，为加快全要素生态系统建设，目前已牵头或参与制定80余项制造业数字化转型标准。《上海市先进制造业发展“十四五”

06-17