Vision Pro 不需要“杀手级应用”
06-21
这是一个聪明的时刻。
去年11月底,ChatGPT横空出世,在全球范围内掀起了人工智能热潮,并以史上最快的速度触达数亿活跃用户。
一年后的同一时间,硅谷出现了另一位“AI明星”,并一夜成名。
11月29日,AI视频生成公司Pika Labs正式公布最新视频生成模型Pika1.0,并上线新网站。
据了解,Pika1.0可以生成和编辑3D动画、动画片、漫画和电影。
几乎没有门槛要求。
用户只需要输入一句话,就可以生成自己想要的各种风格的视频。
此外,用户还可以使用Pika实现画布扩展、本地修改、视频时长扩展等编辑需求。
宣传视频中,皮卡1.0拥有强大的语义理解能力。
如果输入关键词“穿宇航服的马斯克,3D动画”,就会出现一个穿着宇航服的卡通马斯克,身后有一枚SpaceX火箭。
文生视频的清晰度和连贯性远远优于市场上其他人工智能视频生成产品。
Pika Labs 的创始团队也颇具传奇色彩——整个团队目前只有 4 个人。
联合创始人·郭文静是一位来自杭州的“95后”女孩,曾被称为“天才少女”。
郭文·靖和另一位联合创始人孟晨琳都是斯坦福人工智能实验室的中国女博士。
今年4月,他们从斯坦福大学退学,开始自己创业。
井郭文的父亲是A股上市公司新雅达的实际控制人郭华强。
皮卡走红后,新雅达于11月30日、12月1日连续两次涨停,被调侃为“爸爸比女儿更值钱”、“女儿概念股”。
随后,新雅达发布公告,承认郭文王与郭华强之间存在父女关系,但“除上述关系外,公司与皮卡不存在其他关系。
截至目前,郭文王未在公司担任任何职务” ,并且我没有投资Pika的公司,也没有与Pika有任何业务往来。
”目前Pika 1.0的官方网页版需要排队,尚未有用户测试。
有人借此机会质疑一夜爆红的皮卡是否是营销骗局?毕竟,在十一月之前,皮卡还只是一个无名小卒。
事实上,Pika 的第一个版本已于今年 4 月下旬在 Discord 上进行公开测试。
7月,该服务器在Discord上正式上线,几个月内就获得了50万用户。
由于 Pika 团队经过精简并托管在 Discord 平台上,因此可以最大程度地减少开发量。
来源:皮卡官网截图。
最初,Pika仅支持文生视频,后来逐渐支持图像转换为视频、摄像头控制、文本和徽标嵌入视频等。
Pika1.0宣传视频中的许多功能目前Discord上的版本不支持,只能待网页版开放评估后进行验证。
这并不是皮卡第一次出现在公众面前。
今年11月初,在《流浪地球3》发布会上,电影产业化实验室G!Lab正式成立。
郭帆主任介绍了一批战略合作的科技公司,包括商汤科技、小米、华为等,以及皮卡实验室。
截至目前,成立仅6个月的皮卡已完成三轮融资,融资总额达1万美元,估值超10亿元人民币。
投资者阵容也很豪华——包括OpenAI董事会成员Adam D'Angelo和前特斯拉AI总监Andrej Karpathy、前Github首席执行官Nat Friedman、YC合伙人Daniel Gross以及硅谷著名投资人Elad Gil。
01 都是“天才” 皮卡的创始团队可谓都是天才。
郭文场景早在2016年就在社交媒体上火爆。
当时,郭文井作为浙江省第一个提前考入哈佛的学生,被央视报道,被称为“天才少女”。
高一期间,特鲁姆普获得全国青少年信息学奥林匹克联赛(浙江省赛区)一等奖,随后又两次获得奥林匹克数学竞赛冠军。
之后,他受麻省理工学院邀请参加比赛,并获得北美编程邀请赛冠军。
第二名,超越哈佛大学、斯坦福大学、卡内基梅隆大学等大学的团队。
进入哈佛后,郭文一边求学,一边前往 Meta AI Research、微软、Google Brain、Epic Games 等公司实习。
大二时,郭文成为Meta AI研究部门最年轻的全职员工,并获得多项国际软件开发奖项。
获得数学本科学位和计算机科学硕士学位后,郭文前往斯坦福大学继续攻读博士学位。
联合创始人·孟辰林和郭文·井是斯坦福大学的同学。
近三年来,孟晨林发表了多篇研究论文,其中包括去噪扩散隐式模型(DDIM),该模型已成为内容生成的默认方法,并被 OpenAI 的 DALLE-2、Google 的 Imagen 和 Stability 广泛使用AI的稳定扩散。
。
另一位创始人陈思宇据称是郭文井在杭州二中的同学。
陈思雨是信息学和物理国家集训队成员。
后来他被推荐到北京大学,也是第一届图灵班的成员。
4号员工Matan Cohen-Grumi的经验主要集中在创意领域。
郭文井在接受采访时表示,Pika将继续轻量级开发,随着用户激增,今年团队可能会扩大到20人。
发现皮卡的机会来自于一场不为人知的竞争。

2016年,郭文·金和几位博士生决定在寒假期间利用生成式AI制作一部电影,参加Runway举办的首届“AI电影节”大奖赛。
郭文·金对于获奖信心十足,但现实是,几位尖子生为比赛精心准备,最终却未能入围。
在准备过程中,井特普发现目前市面上的视频制作AI工具极其麻烦。
她花了几个小时使用 Runway 和 Adob??e Photoshop 等工具,但收效甚微。
这给了郭文一种创业机会的感觉——为什么不创造一个更容易让普通人使用的AI视频生成器呢? 这个想法提出后,郭文立即采取了行动。
今年4月,郭文井和孟辰林一起从斯坦福大学退学,共同开发Pika。
在开始视频生成业务之前,郭文考虑过在游戏行业工作,因为游戏更容易商业化。
为此,她在斯坦福攻读博士学位期间,前往Epic Games实习,了解游戏行业的痛点。
但后来她发现游戏行业太复杂,AI视频生成仍然是一片蓝海,有更多机会。
目前的创业方向“至少可以做十年”。
? 02 视频生成的“GPT时刻”在今年ChatGPT掀起的大型人工智能模型热潮中,基于大型语言模型的聊天机器人成为最热门的创业方向;而在泛内容生成AI应用中,图像生成是最重要的场景,其次是写作工具和视频生成工具。
与语言模型相比,人工智能生成的视频是完全不同类型的模型。
它与人工智能生成的图像模型有一些共同点,但难度更大。
郭文井在接受媒体采访时表示,视频有很多与图片不同的问题,比如保证视频流畅、保证运动。
视频比图像大,需要更大的 GPU 内存。
视频生成需要考虑逻辑。
问题还要考虑如何生成,是逐帧生成还是一起生成。
现在很多模型是一起生成的,生成的视频很短。
但是如果我们想逐帧生成它怎么办?其中许多是图像生成不会面临的新技术问题。
孟晨琳补充道,视频的每一帧都是一张图片,这比图片要困难得多。
由于每一帧的生成质量必须很高,因此相邻帧之间必须存在相关性。
当视频很长时,确保每一帧都组合在一起可能是一个相当复杂的问题。
在训练过程中,处理视频数据时会处理多幅图像,模型需要适应这种情况。
例如,如何将帧图像传输到GPU就是一个挑战。
推理时,由于涉及生成大量帧,推理速度会比单张图片慢,计算成本也会增加。
此外,控制视频生成更加困难,因为模型需要生成每一帧发生的情况,而用户不想为每一帧提供详细描述。
此外,视频生成涉及更多的空间维度,使得问题更加复杂。
此外,网络视频生成的训练数据集比图像小,这也使得获取高质量数据变得更加困难。
图片来源:皮卡官网截图? 目前,AI生成视频领域的创业已经开始加速。
仅11月份,除了Pika 1.0的发布之外,不少公司还发布了新的视频生成工具。
11月16日,社交媒体巨头Meta发布了工具Emu Video,该工具可以根据文本和图像输入生成视频剪辑;几乎在同一时间,字节跳动发布了 PixelDance 模型,该模型采用描述(纯文本)+首帧引导(图片)+尾帧引导(图片)来生成包含复杂场景和动作的视频。
11月21日,跑道动笔上线。
它的特别之处在于,你只需在任意图片上滑动一下即可将其变成动态视频。
作为最早探索视频生成领域的领导者之一,Runway 在过去的一年里发布了 Gen1 和 Gen2。
11月24日,专注于开发人工智能产品的初创公司Stable AI发布了其最新的AI模型Stable Video Diffusion(稳定视频扩散模型)。
该模型可以从现有图片生成视频,是基于之前发布的 Stable Diffusion 文本到图像模型的扩展。
此外,Adobe在文生视频领域也有新动作。
近日,该公司宣布收购AI视频生成初创公司Rephrase.ai,该公司主要利用AI技术将文本转换为头像视频。
Adobe高级副总裁兼总经理Ashley Still表示,Rephrase.ai团队在生成式AI音视频技术和文本转视频生成工具方面的专业知识将扩展Adobe的生成视频能力。
随着皮卡在文生视频领域的应用验证,业内普遍认为游戏媒体类上市公司可能最先受益。
值得注意的是,不少游戏媒体类上市公司已成功将AIGC技术应用到视频或游戏素材的创作中。
可见,视频领域的竞争日趋激烈,并可能成为下一阶段AI竞争的主场景。
在孟辰林看来,视频领域的竞争可能类似于语言模型的竞争格局——当一家公司发布新模型时,他们内部可能已经有了更先进的模型,在一两年内击败其他公司。
未来,在视频领域,一家公司会向前冲锋一到两年,而其他公司则会迎头赶上。
Pika的火爆或许意味着AI视频生成的“GPT时刻”即将到来。
参考文献:《专访Pika Labs创始人:探索视频生成的GPT时刻》、海外独角兽【本文由投资界合作伙伴《中国企业家》杂志社授权发表。
本平台仅提供信息存储服务。
】如有任何疑问,请联系投资界()。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-21
06-17
06-08
06-17
06-17
06-17
06-17
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态