【全球财经24小时】2023年10月10日投融资事件汇总及明细
06-18
产品介绍:简单来说,Weshop是一款“一键匹配服装产品型号”的AI工具。
用户上传自己拍摄的真实服装图片后,通过其提供的交互界面中简单的复选框和语言描述,就可以生成不同风格的模特图片。
这对于中小电商卖家,尤其是需要国外模式的跨境商家来说,可以节省大量成本。
目前已向公众开放并可免费试用。
今年8月,Stable Diffusion开源了其模型。
进一步降低了对计算设备的需求,同时带来了令人惊叹的图像生成效果。
与很多人玩过的《中途旅程》一起,彻底引爆了AI生成图像的技术应用,引来了口水和争议。
但随着用户数量的增加,人们也为它的不可控性所困扰:一些细节始终无法根据需要生成,导致图片往往无法真正使用——虽然它叫stable,但不太稳定。
直到次年2月,ControlNet的出现改变了一切。
这是一种通过添加更多条件来控制扩散模型的神经网络结构,当添加到稳定扩散中时,它完全改变了其可用性。
当Controlnet Stable Diffusion首次出现时,它并没有立即改变混乱的AI绘画社区。
艺术家和创作者们仍然在困惑和兴奋中讨论和使用这些工具。
然而,在杭州的一间小办公室里,一个一直关注着扩散模型的小团队却感觉,他们等待已久的东西终于出现了。
“我想,这次有机会。
”吴海波对我说。
他是WeShop团队的领导者,开发了基于Diffusion模型的服装模型生成工具。
微商团队是蘑菇街电商的一支特种部队。
他们一直在关注虚拟试衣的方向。
当《稳定扩散》问世时,他们已经在尝试构建自己的各种演示。
当他们看到 ControlNet 时,他们认为是时候做一些更深入的版本了。
ControlNet让一项期待已久的技术进入了商业场景,另一个影响也在4月份到来——Meta的Segment Anything出现了。
这是图分割的基本模型,让人们只需通过即时工程就能高效地完成高质量的图分割。
这是一个飞跃,每个人都爆炸了。
吴海波回忆起自己所在的技术讨论组看到这篇论文的那天晚上。
“那天晚上大家都很热闹,因为你一直在做相关的工作,你会发现当你看到这个技术的时候,你的理解和别人不一样。
你一直困扰的事情你认为它可以立即得到解决。
”然后一个半星期后。
很快,微商的新计划就完成了。
今天打开WeShop的网站,可以看到它是三栏布局。
“最左边是功能图,你可以理解为我今天请的AI摄影师,他目前主要在做这个场景,但是以后我们会有很多场景。
比如你要拍淘宝、拍小红书、拼多多、亚马逊,以前只能一套图多用,现在完全可以了。
”简单来说,微商就是“一键购买服装产品”。
”。
匹配模型”人工智能工具。
用户上传拍摄的真实服装图片后,可以使用提供的交互界面,通过简单的复选框和语言描述,生成不同风格的模特图片。
他们还可以选择让这些模型出现在不同的背景中。
这可以为中小电商卖家,尤其是需要国外模式的跨境商家节省大量成本。
目前已向公众开放,可以免费试用。
以下是一些真实的例子。
可以看到,很难区分它生成的图片和真实模型拍摄的图片。
当“商家比我们聪明”的技术方案确定后,微商也很快选定了两个主要的商业场景:一是外模场景,二是“真人场景”。
前者来自微商这几年与跨境商家的接触。
他们普遍难以找到合适的国外模特,而疫情更是加深了这种苦恼;另一个是基于蘑菇街的电商经验。

“做了这么多年电商,我们真的很讨厌产品版本不对。
我们认为,必须设定一个底线,即任何一套技术如果会改变产品本身的细节,在销售过程中就会出现问题,我们就不能“所以WeShop设计了真人、人体模型的概念”。
“人体模型意味着,尽管你买不起真正产品的模型,但你可以把它戴在自己身上。
只要你这样拍,那是什么都无所谓。
无论您在哪里拍摄,我们都可以为您生成。
模特照片好看。
我们产品的反复迭代,就是为了降低您对图片本身的要求,这也是我们未来会继续做的事情。
“第二个是真人,就是国内有很多卖家,他其实拍过照片,拍完照片后我们可以帮他替换图片,生成另一种图片。
”并将产品逐步提供给商家。
试用结束后,商家提出了更多有趣的诉求。
一是如今网红带货爱说的“氛围感”。
很多商家反映,确实需要去除背景,即改变产品的背景或者改变各个地方,而传统技术会显得不够逼真。
“然后我们发现我们花了一点功夫,效果很好,所以我们就开始做了。
”更让开发团队惊讶的是聪明的商家发明的使用技巧。
在头像的生成过程中,难免会出现一些崩溃的问题。
weshop团队最初想到了各种方法,比如要求商家购买真人头像并要求其有头部,或者用技术方法为每个头像重新生成一个头部。
最后发现用户自己解决了。
方法很简单,就是上传图片的时候,同时在头部涂抹两遍,就可以了。
“我们想得太多了,用户比我们聪明得多,”他说。
这种方法从技术角度可以立即理解,并且有助于模型识别更准确。
“我们很快就会有一个新功能,让画画变得更简单。
我可以直接在身边画画,不用再去美图秀秀或者Photoshop画画。
后面我们会添加一个小工具来扩展,大家可以应用“越来越多的企业开始使用它,越来越多的企业开始付费。
目前微商城的订阅价格为人民币/月、人民币/月、人民币/月,对应的算力点分别为0、0、00,分别可生成约1、0、0张商业照片。
此外,微商还提供“加油套餐”作为算力的补充,有25元、1元、1元三个级别可供选择。
在这种收费逻辑下,用户使用微商越熟练,算力的浪费就越少,即单张商业照片的价格就越低。
作为基于新流行的人工智能技术开发的产品,产品经理思维也意味着它在开发过程中要面对新的问题,以及解决新问题的技术路线的选择和权衡。
技术方案确定后,微店团队面临的最大挑战仍然是如何让这个技术方案在业务流程中听从他们的意见。
使扩散模型可控总是非常困难的。
如果你将扩散视为一个人,他是一个非常顽皮的人,有自己的想法。
例如,吴海波介绍了一个调皮的例子:“大多数时候我们把图像剪下来之后,Diffusion模型喜欢在产品的边缘做一些他自己的修饰。
比如他在你的袖子上加了一条链子。
”或者说你明明穿着高跟鞋,他给你加了一些图案,就是在你的鞋帮上加了一些东西,在你的鞋跟上加了一些东西,他很喜欢做这些事情。
”但当面对这样的事情时。
针对这个问题,微商团队也想出了很多算法科学家都已经解决的解决方案——他们开发了一个模型。
“根据我们当时的了解,这是部分重绘的场景,所以我们当时开发了一个模型,可以缓解很多这样的问题。
”吴海波说道。
但当模型上线后,他们在测试过程中发现,这个模型会让整体照片的质感趋于油画般的感觉,就好像加了一层滤镜一样——这是只有产品经理才能发现的问题。
“对于产品经理来说,他们只关注这个东西,而且非常仔细地关注。
我们自己的测试集没有问题。
如果是论文中发表的开发算法的思路,这已经足够了,但是我们根据很多用户之前运行过的案例,选择再次运行该案例,当我将两张图片放在一起对比时,我发现在某些情况下出现了过滤器的感觉。
”吴海波说。
团队为此争论了一周。
“这是一个电商场景,他拿回来就得处理一下。
我最好给他一部iPhone原片,或者单反相机的原片,他可以再处理一下。
但是如果我给了他,他就无法使用它,感觉会有所不同,而且图片会太多。
“最后,我们决定取消我们自己开发的模型。
”海波说:“我们迭代一个模型是非常困难的,把一个模型放到线上来解决一个非常重要的问题并不容易,但最终我们强行把它下线了,从来没有让它出现在客户面前。
这也形成了WeShop的产品思路。
产品经理的比例会大于纯粹的算法或技术思路,因为后者往往会陷入炫技的陷阱。
WeShop团队也经常讨论为什么GPT会出来OpenAI而不是Google。
一个结论是,对于同一个模型,如何调整有不同的理解。
“在我们的实践过程中,我们制作的照片中的脸很少塌陷,因为我们不能接受塌陷的脸。
因为我是做产品的,怎么能让整个脸塌陷成鬼样子?这是不能接受的。
”但如果是工程团队或者学术团队,我现在做完第一波之后,就公开测试一下,如果我的指标好的话,那么从我的情况来看,只要我面的概率就可以了。
崩溃率低于100%,这一套东西和我们以前做的算法很相似,就是做完之后我们再做下一篇。
海波记得OpenAI也有类似的经历,他们和谷歌的区别在于,OpenAI的人就像一个产品团队,开发出来后会继续使用产品,而学术界的谷歌团队则在完成后进入下一个主题。
“但只有产品经理。
只有对产品负责的人才会像对待自己的孩子一样一遍又一遍地对待它。
只有当你反复使用它时,你才会知道它的边界已经超出了你的知识范围,你引导回来的技术方向也会有所不同。
“吴海波认为,他们能达到今天的水平,是因为他们练习SD的次数远远多于其他人。
“它的边界在哪里?我们尝试的案例比别人多,所以当我们的产品第一天推出的时候,别人可能不太明白我们为什么能达到这样的效果。
其实历史上每次都是这样。
”有一批人对这个东西有了更好的理解,因为他们用得足够多了,然后他们做了一些不同的事情。
” 6月中旬,谷歌还发布了用于虚拟试衣的TryOn Diffusion,可以向客户展示衣服在不同形状和尺寸的真实模特上的样子,它基于扩散框架,并统一了两个Parallel-Unet以实现更好的控制。
实现这种效果的一个重要方法是基于谷歌自己的计算资源进行大量训练,“我们也看了它的研究,这实际上证明了这条路的前景。
“大公司已经用暴力证明了这条路,开源社区以后也会进一步认识到这一点。
”吴海波说。
虚拟试衣看起来越来越近了。
然而,在如此蓬勃发展的技术中,单一产品并不是唯一的选择。
微商团队经常思考什么才是AI原生产品。
“当然,这个产品今天推出还比较早,但我们内部有一些想法。
“他们可能不对,但他们走得更远。
”吴海波说。
他认为,在AI Agent的方向上,未来很多AI工具最终会结合在一起,有点像AI管理经理。
“今天的大模特有点像常春藤盟校的学生,读的书最多,背景也很好,他什么都知道,什么都可以和你聊,但他就是不知道你的生意问题是什么。
” “虽然AI技术很强大,但总需要一定的流程把它串起来。
如何串起来可能还不知道,但我们会先创造一些具体的场景,谁可能最先发现这个业务。
”数据闭环或者业务闭环的过程中,谁能反馈并直接与AI进行迭代,谁的“扩散”壁垒最深。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-18
06-18
06-18
最新文章
首先告诉我什么是智能汽车!
盲盒明星卡的暴利与泡沫:2元卡卖700万,直播卖卡月入百万
黑色星期五轰轰烈烈地回来了,结果这些中国企业扛起了全场
锂电池隔膜疯狂扩产:兴源材料欲夺回C位?
当我考上缅语专业时:凌晨三点我还在走廊里背单词,毕业后,我不仅仅是一名翻译者
被遗弃,被收获?老年人上网到底有多难?
海外日报 -今年,我国自主研发游戏海外实际销售收入实现两位数增长;三星电子正式成立机器人业务团队36氪海外·15分钟前
腾讯音乐:爱、相信、坚持