中国ESG新故事:主动、常态、变革
06-18
NVIDIA显卡销量如此之高,让人几乎忘记了它也是生成式AI巨头。
近日,NVIDIA的最新论文披露了一种名为Perfusion“王牌图”模型的个性化学习技术。
官网介绍,Perfusion技术由NVIDIA和以色列特拉维夫大学联合开发。
Perfusion技术可以帮助Free Creative生成更加个性化的物体,达到更加生动的效果,具有更好的提示匹配性,并且不易受到原始图像背景特征的影响。
NVIDIA 图形研究人员 Yao Aaron Lefohn 曾将Perfusion技术描述为“高度紧凑的技术,允许用户将多个个性化元素(例如特定的泰迪熊和茶壶)组合到单个 AI 生成的视觉效果中。
”在此,NVIDIA 使用了一种称为“密钥锁定”的新颖机制。
一种流行的解释是,它将图像生成模型中的注意力机制分为两部分:位置部分和内容部分。
位置部分决定绘制什么对象,内容部分决定对象的外观风格。
“钥匙机构”固定位置部分,防止物体随意改变。
例如,特定泰迪熊的位置与所有修改过的泰迪熊一致。
同时,内容部分允许自由改变物体的外观,比如凭空改变泰迪熊的服装。
此外,Perfusion技术可以选择控制文生图过程中对象的变化程度,是能够更像原始对象,还是更符合用户的描述。
从历史记录生成的多个对象也可以组合在同一图像中。
得益于“密钥锁定”机制的进步,官方声称Perfusion技术生成的图像质量已与 Stability Diffusion v1.5 相当。

然而,Perfusion技术更加个性化,能够快速学习处理新概念,而无需重新训练整个模型,这是稳定性扩散所不具备的。
此外,Perfusion技术提供了更大的控制能力,更容易平衡视觉质量和语义控制,并结合多个新概念(例如让模型同时生成特定的泰迪熊和特定的茶壶)。
总的来说,Perfusion技术主要在个性化学习和控制方面进行创新,使得文生图的系统生成更容易定制。
很多人可能不知道的是,低调的NVIDIA其实在生成式AI领域取得了巨大的成就,在图像超分辨率、深度估计等多项生成任务上做出了开创性的贡献。
今年5月,NVIDIA创始人黄仁勋大胆预测:“计算机行业正在同时经历两个变革——加速计算和生成人工智能。
它补充道:“随着公司竞相将生成式人工智能应用到每一种产品、服务和业务流程中,价值万亿美元的数字中心基础设施将升级为加速计算。
”大规模生成式人工智能训练神经网络需要高度复杂的计算能力。
GPU的通用性更强,更适合大规模并行计算,其设计和制造工艺也相对成熟。
这正是NVIDIA掌握大型AI模型“生命之门”的舒适区。
从市场份额来看,NVIDIA占据了GPU市场84%的份额。
根据市场研究公司TrendForce公布的数据,如果按照NVIDIA A显卡的处理能力计算,运行ChatGPT将需要使用0个NVIDIA GPU,这意味着NVIDIA将赚取超过3亿美元。
然而,得天独厚的NVIDIA并不只满足于做“淘金者、卖水者”。
而是充分释放了自身资源在生成模型技术开发领域的“天才”。
2017年,NVIDIA研究人员率先提出了生成对抗网络StyleGAN,这是第一个能够生成高质量人脸图像的GAN模型。
一年后,NVIDIA正式发布了第一个可以直接从语义布局生成面部图像的GAN模型。
逼真图像的模型。
类似的“第一”还有很多。
如今,Perfusion技术是 NVIDIA 最新生成式 AI 版本的成果之一。
Perfusion技术的发布,一方面可以继续展示NVIDIA在生成式AI领域的技术能力,充分确立NVIDIA在生成式AI领域的领导地位和影响力。
另一方面,也可以响应工业界和学术界的热点需求,然后在未来集成到NVIDIA的产品和服务中。
值得注意的是,目前NVIDIA仅在其官网上发表了相关论文,具体代码演示将很快推出。
届时,用户对于文生图功能需求将有更加多元化的选择。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-17
06-17
06-17
06-18
06-18
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态