首页 > 技术迭代 > 内容

通过驯服顽皮的 Diffusion，服装销售商将不再担心聘请模特！

发布于：2024-06-28 编辑：匿名来源：网络

产品介绍：简单来说，Weshop是一款“一键匹配服装产品型号”的AI工具。

用户上传自己拍摄的真实服装图片后，通过其提供的交互界面中简单的复选框和语言描述，就可以生成不同风格的模特图片。

这对于中小电商卖家，尤其是需要国外模式的跨境商家来说，可以节省大量成本。

目前已向公众开放并可免费试用。

今年8月，Stable Diffusion开源了其模型。

进一步降低了对计算设备的需求，同时带来了令人惊叹的图像生成效果。

与很多人玩过的《中途旅程》一起，彻底引爆了AI生成图像的技术应用，引来了口水和争议。

但随着用户数量的增加，人们也为它的不可控性所困扰：一些细节始终无法根据需要生成，导致图片往往无法真正使用——虽然它叫stable，但不太稳定。

直到次年2月，ControlNet的出现改变了一切。

这是一种通过添加更多条件来控制扩散模型的神经网络结构，当添加到稳定扩散中时，它完全改变了其可用性。

当Controlnet Stable Diffusion首次出现时，它并没有立即改变混乱的AI绘画社区。

艺术家和创作者们仍然在困惑和兴奋中讨论和使用这些工具。

然而，在杭州的一间小办公室里，一个一直关注着扩散模型的小团队却感觉，他们等待已久的东西终于出现了。

“我想，这次有机会。

”吴海波对我说。

他是WeShop团队的领导者，开发了基于Diffusion模型的服装模型生成工具。

微商团队是蘑菇街电商的一支特种部队。

他们一直在关注虚拟试衣的方向。

当《稳定扩散》问世时，他们已经在尝试构建自己的各种演示。

当他们看到 ControlNet 时，他们认为是时候做一些更深入的版本了。

ControlNet让一项期待已久的技术进入了商业场景，另一个影响也在4月份到来——Meta的Segment Anything出现了。

这是图分割的基本模型，让人们只需通过即时工程就能高效地完成高质量的图分割。

这是一个飞跃，每个人都爆炸了。

吴海波回忆起自己所在的技术讨论组看到这篇论文的那天晚上。

“那天晚上大家都很热闹，因为你一直在做相关的工作，你会发现当你看到这个技术的时候，你的理解和别人不一样。

你一直困扰的事情你认为它可以立即得到解决。

”然后一个半星期后。

很快，微商的新计划就完成了。

今天打开WeShop的网站，可以看到它是三栏布局。

“最左边是功能图，你可以理解为我今天请的AI摄影师，他目前主要在做这个场景，但是以后我们会有很多场景。

比如你要拍淘宝、拍小红书、拼多多、亚马逊，以前只能一套图多用，现在完全可以了。

”简单来说，微商就是“一键购买服装产品”。

”。

匹配模型”人工智能工具。

用户上传拍摄的真实服装图片后，可以使用提供的交互界面，通过简单的复选框和语言描述，生成不同风格的模特图片。

他们还可以选择让这些模型出现在不同的背景中。

这可以为中小电商卖家，尤其是需要国外模式的跨境商家节省大量成本。

目前已向公众开放，可以免费试用。

以下是一些真实的例子。

可以看到，很难区分它生成的图片和真实模型拍摄的图片。

当“商家比我们聪明”的技术方案确定后，微商也很快选定了两个主要的商业场景：一是外模场景，二是“真人场景”。

前者来自微商这几年与跨境商家的接触。

他们普遍难以找到合适的国外模特，而疫情更是加深了这种苦恼；另一个是基于蘑菇街的电商经验。

通过驯服顽皮的 Diffusion，服装销售商将不再担心聘请模特！

“做了这么多年电商，我们真的很讨厌产品版本不对。

我们认为，必须设定一个底线，即任何一套技术如果会改变产品本身的细节，在销售过程中就会出现问题，我们就不能“所以WeShop设计了真人、人体模型的概念”。

“人体模型意味着，尽管你买不起真正产品的模型，但你可以把它戴在自己身上。

只要你这样拍，那是什么都无所谓。

无论您在哪里拍摄，我们都可以为您生成。

模特照片好看。

我们产品的反复迭代，就是为了降低您对图片本身的要求，这也是我们未来会继续做的事情。

“第二个是真人，就是国内有很多卖家，他其实拍过照片，拍完照片后我们可以帮他替换图片，生成另一种图片。

”并将产品逐步提供给商家。

试用结束后，商家提出了更多有趣的诉求。

一是如今网红带货爱说的“氛围感”。

很多商家反映，确实需要去除背景，即改变产品的背景或者改变各个地方，而传统技术会显得不够逼真。

“然后我们发现我们花了一点功夫，效果很好，所以我们就开始做了。

”更让开发团队惊讶的是聪明的商家发明的使用技巧。

在头像的生成过程中，难免会出现一些崩溃的问题。

weshop团队最初想到了各种方法，比如要求商家购买真人头像并要求其有头部，或者用技术方法为每个头像重新生成一个头部。

最后发现用户自己解决了。

方法很简单，就是上传图片的时候，同时在头部涂抹两遍，就可以了。

“我们想得太多了，用户比我们聪明得多，”他说。

这种方法从技术角度可以立即理解，并且有助于模型识别更准确。

“我们很快就会有一个新功能，让画画变得更简单。

我可以直接在身边画画，不用再去美图秀秀或者Photoshop画画。

后面我们会添加一个小工具来扩展，大家可以应用“越来越多的企业开始使用它，越来越多的企业开始付费。

目前微商城的订阅价格为人民币/月、人民币/月、人民币/月，对应的算力点分别为0、0、00，分别可生成约1、0、0张商业照片。

此外，微商还提供“加油套餐”作为算力的补充，有25元、1元、1元三个级别可供选择。

在这种收费逻辑下，用户使用微商越熟练，算力的浪费就越少，即单张商业照片的价格就越低。

作为基于新流行的人工智能技术开发的产品，产品经理思维也意味着它在开发过程中要面对新的问题，以及解决新问题的技术路线的选择和权衡。

技术方案确定后，微店团队面临的最大挑战仍然是如何让这个技术方案在业务流程中听从他们的意见。

使扩散模型可控总是非常困难的。

如果你将扩散视为一个人，他是一个非常顽皮的人，有自己的想法。

例如，吴海波介绍了一个调皮的例子：“大多数时候我们把图像剪下来之后，Diffusion模型喜欢在产品的边缘做一些他自己的修饰。

比如他在你的袖子上加了一条链子。

”或者说你明明穿着高跟鞋，他给你加了一些图案，就是在你的鞋帮上加了一些东西，在你的鞋跟上加了一些东西，他很喜欢做这些事情。

”但当面对这样的事情时。

针对这个问题，微商团队也想出了很多算法科学家都已经解决的解决方案——他们开发了一个模型。

“根据我们当时的了解，这是部分重绘的场景，所以我们当时开发了一个模型，可以缓解很多这样的问题。

”吴海波说道。

但当模型上线后，他们在测试过程中发现，这个模型会让整体照片的质感趋于油画般的感觉，就好像加了一层滤镜一样——这是只有产品经理才能发现的问题。

“对于产品经理来说，他们只关注这个东西，而且非常仔细地关注。

我们自己的测试集没有问题。

如果是论文中发表的开发算法的思路，这已经足够了，但是我们根据很多用户之前运行过的案例，选择再次运行该案例，当我将两张图片放在一起对比时，我发现在某些情况下出现了过滤器的感觉。

”吴海波说。

团队为此争论了一周。

“这是一个电商场景，他拿回来就得处理一下。

我最好给他一部iPhone原片，或者单反相机的原片，他可以再处理一下。

但是如果我给了他，他就无法使用它，感觉会有所不同，而且图片会太多。

“最后，我们决定取消我们自己开发的模型。

”海波说：“我们迭代一个模型是非常困难的，把一个模型放到线上来解决一个非常重要的问题并不容易，但最终我们强行把它下线了，从来没有让它出现在客户面前。

这也形成了WeShop的产品思路。

产品经理的比例会大于纯粹的算法或技术思路，因为后者往往会陷入炫技的陷阱。

WeShop团队也经常讨论为什么GPT会出来OpenAI而不是Google。

一个结论是，对于同一个模型，如何调整有不同的理解。

“在我们的实践过程中，我们制作的照片中的脸很少塌陷，因为我们不能接受塌陷的脸。

因为我是做产品的，怎么能让整个脸塌陷成鬼样子？这是不能接受的。

”但如果是工程团队或者学术团队，我现在做完第一波之后，就公开测试一下，如果我的指标好的话，那么从我的情况来看，只要我面的概率就可以了。

崩溃率低于100%，这一套东西和我们以前做的算法很相似，就是做完之后我们再做下一篇。

海波记得OpenAI也有类似的经历，他们和谷歌的区别在于，OpenAI的人就像一个产品团队，开发出来后会继续使用产品，而学术界的谷歌团队则在完成后进入下一个主题。

“但只有产品经理。

只有对产品负责的人才会像对待自己的孩子一样一遍又一遍地对待它。

只有当你反复使用它时，你才会知道它的边界已经超出了你的知识范围，你引导回来的技术方向也会有所不同。

“吴海波认为，他们能达到今天的水平，是因为他们练习SD的次数远远多于其他人。

“它的边界在哪里？我们尝试的案例比别人多，所以当我们的产品第一天推出的时候，别人可能不太明白我们为什么能达到这样的效果。

其实历史上每次都是这样。

”有一批人对这个东西有了更好的理解，因为他们用得足够多了，然后他们做了一些不同的事情。

” 6月中旬，谷歌还发布了用于虚拟试衣的TryOn Diffusion，可以向客户展示衣服在不同形状和尺寸的真实模特上的样子，它基于扩散框架，并统一了两个Parallel-Unet以实现更好的控制。

实现这种效果的一个重要方法是基于谷歌自己的计算资源进行大量训练，“我们也看了它的研究，这实际上证明了这条路的前景。

“大公司已经用暴力证明了这条路，开源社区以后也会进一步认识到这一点。

”吴海波说。

虚拟试衣看起来越来越近了。

然而，在如此蓬勃发展的技术中，单一产品并不是唯一的选择。

微商团队经常思考什么才是AI原生产品。

“当然，这个产品今天推出还比较早，但我们内部有一些想法。

“他们可能不对，但他们走得更远。

”吴海波说。

他认为，在AI Agent的方向上，未来很多AI工具最终会结合在一起，有点像AI管理经理。

“今天的大模特有点像常春藤盟校的学生，读的书最多，背景也很好，他什么都知道，什么都可以和你聊，但他就是不知道你的生意问题是什么。

” “虽然AI技术很强大，但总需要一定的流程把它串起来。

如何串起来可能还不知道，但我们会先创造一些具体的场景，谁可能最先发现这个业务。

”数据闭环或者业务闭环的过程中，谁能反馈并直接与AI进行迭代，谁的“扩散”壁垒最深。

站长声明

标签：

上一篇：谁还在使用短信？

下一篇：在大众之前，董事长进军汽车芯片

【全球财经24小时】2023年10月10日投融资事件汇总及明细

今日全球市场共发生29起投资披露事件，其中境内16起，境外13起。其中，国内先进制造业7例、医疗健康行业3例、传统制造业2例、企业服务业2例、汽车交通行业1例、在金融行业。外企服务业3例、医疗健康行业4例、先进制造业1例、区块链行业1例、电子商务行业2例、农业行业1例，

06-18
君乐宝乳业获红杉资本中国基金超12亿元战略投资

据投资界3月18日消息，石家庄君乐宝乳业股份有限公司（以下简称“君乐宝”）近日完成了投资超过12亿元人民币。战略融资。本轮投资方为红杉资本中国基金，已成为公司第一大机构股东，持股比例为15.26%。君乐宝成立于2007年，25年来专注乳制品行业发展，为消费者提供健康、

06-17
踏歌智行再获亿元战略投资，B轮融资总额近4亿

鎶曡祫鍦堬紙ID锛歱edaily锛夋嵁8鏈?0鏃ユ秷鎭紝韪忔瓕鏅鸿瀹ｅ竷瀹屾垚B3杞?浜跨泩绉戞姇璧勯鎶曠殑浜烘皯甯佹垬鐣ヨ瀺璧勩?傝??鏄庤祫鏈媴浠绘湰娆瀺璧勭殑鐙淇濊崘浜恒?傝笍姝屾櫤琛孊杞瀺璧勬鍓嶅凡鑾峰緱鍓嶆捣姣嶅熀閲戙?佸疂閫氭姇璧勩?佸崕浜烘枃鍖栧

06-18
131便利店获春晓资本4000万元融资，将从供应链发力，打造产业链闭环

据投资界4月24日消息，便利店今日宣布，已获得1万元天使轮融资，投资方为春晓资本。创始人陈登旺表示，本轮融资的目的是增加实体店数量、搭建大数据平台、引进优秀人才、扩大团队等。　　便利店通常销售SKU~SKU产品，这主要辐射周边消费群体。其SKU或产品的应用场景主要是

06-18
美食短视频平台“RiRiChu”完成2000万美元B+轮融资

投资圈（ID：pedaily）8月20日报道，美食短视频平台——RiRiChu近日完成1万美元B+轮融资，投资者为达丽斯资本和Ironfire Ventures。 RiRiCui成立于2017年，是一个专注于“以食物为灵感，体验厨房乐趣”的生活方式品牌。它专注于创造适合家庭烹饪的高品质食谱。它以短视频为

06-18
中植软创完成数千万元融资，基石基金投资

投资社区（ID：pedaily）8月27日消息，近日，化工行业智慧管控领军企业中植软创正式融资宣布已完成数千万元人民币融资。本轮融资由基石基金投资，浩石资本独家投资。本次融资将主要用于实时优化（RTO）业务的研发和人才培训。北京中智软创新信息技术有限公司（简称“中智软

06-18
盖泽科技完成数百万级A轮融资，苏创投国发创投、苏高新容盛、元和元电纷纷出手

投资界（ID：pedaily）11月29日消息，盖泽精密科技（苏州）盖泽科技股份有限公司（以下简称“盖泽科技”）于今年11月完成新一轮融资，本轮融资金额达数千万元，本轮融资由联合投资由苏创投国发创投、苏高鑫融盛、元禾本源、泽禾创投、卓源资本等机构融资的资金将主要用于团队

06-18
继宝马、奔驰、特斯拉挖角研发人员后，电动汽车初创公司 FMC 又获 2 亿美元融资

据投资界 8 月 16 日消息，电动汽车初创公司 FMC（Future Mobility Corporation）宣布完成新一轮融资2亿美元，投资方包括丰盛控股、紫金科技。同时，FMC将于今年第四季度启动B轮融资，预计上半年完成。 FMC总裁戴雷（Daniel Kirchert）表示，本轮融资大部分资金将用于产品开

06-18
2019年双创政策回顾：从“抢人”到抢技术、围剿大企业？

，“推动制造业高质量发展”是今年七项重点任务之首。国家和地方政府集中力量加强创新能力和创业保障体系建设，创新创业整体素质提升。但经济下行压力持续加大，整体基础研究能力依然薄弱，不少企业面临生产经营困难。为加快创新、支持民营企业、稳定就业，相关政策频频出

06-18
门海微电子完成1亿元C轮融资，提供新能源物联网芯片及模组

投资界（ID：pedaily）4月28日消息，苏州门海微电子科技有限公司（以下简称“门海微电子”）门海微电子“”）近日完成1亿元C轮融资。元和控股、复星锐正资本、苏州园区科技创新基金、南通濠智等共同完成本轮投资。融资资金将主要用于光伏产品研发、市场开拓和补充流动资金。

06-17
年轻人抢购黄金

这次年轻人似乎比预想的更早爱上了黄金。几年前，黄金在年轻人眼中还是长辈专属的“俗物”。现在他们开玩笑说自己“年少不知金香”。 “当年有多少大妈抢购黄金的言论，就说明现在人们对黄金的热爱有多深。 ”今年以来，金价不断上涨。 1月1日，国内黄金价格每克已达100元。

06-18
知名会计师事务所为何在中国遭质疑：等待上市的公司

美国证券交易委员会（SEC）近日指控德勤、安永、毕马威、普华永道和另一家德豪国际会计师事务所违规。一家会计师事务所在华子公司在涉及中国公司的会计欺诈调查中拒绝提供监管机构要求的审计文件，违反了美国证券法规。消息一出，业界震惊，涉及中国企业赴美上市涉嫌欺诈的

06-18