解决工业领域信息安全问题,“木连科技”完成近亿元B轮融资
06-17
斯坦福华裔博士休学创业,立刻火爆AI圈! 该新品瞄准AI视频生成,自上市以来就成为行业顶尖领军者,引来不少大佬的好评。
OpenAI专家Andrej Karpathy转发并热情附上长文:每个人都可以成为多模态梦想的导演,就像《盗梦空间》中的梦想建造者一样。
就连Stability AI的创始人也对其赞不绝口:这款新产品被称为Pika 1.0,其背后的公司Pika于今年4月成立。
要知道,这个行业已经有很多产品了,比如像Runway这样的公司,已经成立了5年了。
在AI视频产生“乱眼”的当下,这款新品如何快速突破并吸引大量关注? 从发布的演示效果来看,Pika 1.0不仅可以流畅地生成基于文字和图片的视频,还可以瞬间切换动态和静态:可编辑性也很强。
您可以指定视频中的任意元素,并用一句话快速实现。
“改变面貌”:这样的效果也让公司成立仅半年就拥有超过52万的产品用户。
它还获得了 10,000 美元的新融资,投资方包括个人投资者,包括 Quara 创始人 Adam D’Angelo、Perplexity 首席执行官 Aravind Srinivas、GitHub 前首席执行官 Nat Friedman 等。
那么,Pika 真的像看起来那么有用吗?我们也立刻开始体验。
1. 新的顶级AI视频主播是什么样的? 此次火爆的Pika 1.0是Pika发布的第一个正式版本产品。
经过 Discord 社区四个多月的测试,Pika 认为是时候推出这一重大升级了。
与之前只能使用文本或图像生成视频的Pika相比,如今的Pika 1.0功能更加丰富——它不仅可以根据文本、图片或视频风格生成视频,还可以对视频进行部分编辑。
它的可编辑性如何? 不仅可以任意扩大屏幕尺寸,从5:2、1:1画布,到9:16和16:9超大屏幕,4种选项可以无缝转换:3D、动画、电影等各种风格滤镜等等镜子,更不用说了。
最重要的是,1.0正式版推出了更加人性化的网页版,你可以直接开始玩,而不必在不和谐的环境中一遍又一遍地玩Aitebot。
当然,你也可以去Discord社区先上手体验一下。
虽然网页版还没有更新到Pika 1.0,但是我们也测试过文字和图片生成视频的效果,还不错。
加入社区后,直接进入“Creations”,选择下面10代区域中的任意一个即可开始玩。
在输入框中输入“/”,选择最简单的“/create”命令:这里我们输入提示词“a robots dance in the rain, Sunset, 4k, -gs 8”,交给机器人。
大概半分钟左右,视频就出来了,速度还蛮快的: ? 至于效果,下雨不是很明显,但是机器人的身体动力确实很强。
让我们再做一个稍微长一点的提示:一个青少年走过城市街道,拍摄一些地方的照片(一个青少年走过城市街道,拍摄一些地方的照片)仍然超级快,结果出来了:哇,这次真的有效了非常满意了,画面符合我们心中的预测,甚至比我们想象的还要好。
除了纯文本之外,我们还可以使用“/animate”命令上传参考图片进行创作。
当当,静态表情包开始动起来:一般来说,皮卡给的视频时长是3s(所以提示词太长也没用,后面会忽略),不保证。
每次的结果我都很满意,但总的来说,多尝试几次还是能得到不错的结果。
除了自测之外,我们还看看网友们的作品,很多作品的效果都非常惊艳。
比如有人创造的这个小怪物,幼稚得让人忍不住想摸一摸:还有两个小女孩玩耍的场景。
看完之后,我仿佛真的听到了里面传来优美的声音: 最神奇的是,最引人注目的就是这一幕白鸽子围着短发美女飞翔的场景: 好大气啊~ 看完上面的效果,我们来一张看看这家公司是做什么的。
2. 两位斯坦福大学的中国博士创立了Pika。
Pika的创始人有两位,郭黛米和孟陈琳,都是斯坦福大学的博士。
据The Information报道,郭文晶今年4月创立了Pika,随后孟晨霖加入联创。
两人合作开发了这个文本生成视频模型。
从他们的学术经历来看,他们分别专注于NLP和计算机视觉两个方向的AI研究,并且都拥有生成式AI的学术经验。
联合创始人兼首席执行官郭文京拥有斯坦福大学人工智能实验室(NLP & Graphics)博士学位。
她出生在美国,长在杭州。
初中就读于杭州外国语学校。
她从小就接触编程,并获得过IOI银牌。
她正式出国留学本科,并提前考入哈佛大学。
对于这家初创公司,她的 LinkedIn 页面显示她正在休假,这意味着她计划先自己创业。
在斯坦福大学攻读博士学位之前,郭文京获得了哈佛大学计算机科学硕士学位和数学学士学位。
在本科学习期间,她利用了间隔年,在 Facebook AI Research 全职担任了一段时间的研究工程师。
任职期间,她参与了利用 Transformer 分析 2.5 亿条蛋白质序列的研究。
这篇论文被+引用了,其中包括后来一炮而红的AlphaFold2:此外,她还曾在Epic Games、谷歌和微软等多家公司实习过。
郭文景的导师Christopher D Manning在创业过程中也给予了很大的支持。
Christopher D Manning 因其在 NLP 领域的研究而闻名,目前在 Google Scholar 上的引用次数已超过 230,000 次,他也将成为 Pika 的学术顾问之一。
联合创始人兼首席技术官孟晨林也是斯坦福大学计算机科学博士。
在此之前,她于 2011 年获得斯坦福大学数学学士学位。
相比郭文静在NLP领域的研究经历,她在计算机视觉和3D视觉方面拥有更丰富的学术经验。
她参与的去噪扩散隐式模型(DDIM)论文,目前单次引用为+:此外,她还在ICLR、NeurIPS、CVPR、ICML等顶级会议上发表了多篇生成式AI相关研究论文,其中多人被选入Oral。
当然,随着Pika 1.0的流行,Pika也启动了进一步的招聘计划,需求涵盖从技术、产品到运营: 3、一个月内推出了五款产品。
值得一提的是,不仅是正在迅速扩张的鼠兔。

就AI视频行业而言,这段时间迎来了“爆发期”。
据不完全统计,从11月至今,短短一个月内已有五款AI视频生成产品发布或获得重大更新:首先是11月3日,Runway的Gen-2发布里程碑更新,支持4K超写实清晰度工作。
然后时间到了11月16日,Meta发布了Emu Video。
该工具在用户评价中声称击败了Gen-2、Pika等对手。
效果是这样的:从鸸鹋开始,大家好像都在玩一个游戏,这个游戏叫“争夺”。
仅仅两天后,即11月18日,Byte中途发布了PixelDance。
这项工作的动态性在历史上是前所未有的。
画面中的元素均大范围移动,不变形,引人注目。
仅仅三天后,即11月21日,AIGC领域的领军企业Stable AI终于推出了自己的视频工具:Stable Video Diffusion。
这是有效的,而且非常有效。
当天,Gen-2也没闲着。
它推出了“画到哪里就移动到哪里”的全新运动画笔功能,这直接标志着生成模型可控性的重要里程碑。
终于,今天11月29日,来自一家初创公司的Pika直接以网页版发布了正式版1.0,挑战“老大哥”Runway。
除此之外,我们从未见过如此多来自不同背景的独特产品竞相出现在任何舞台上。
这也让人不得不感叹:AI视频是否正处于爆发前夜? 【本文由投资社区合作伙伴微信公众号授权:量子比特。
本平台仅提供信息存储服务。
】如有任何疑问,请联系投资界()。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-17
06-18
06-18
06-17
06-17
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态