打造德国版“去哪儿”,Omio获新一轮1亿美元融资
06-18
OpenAI发布了*Vincent视频模型Sora,它可以使用文本命令生成长达1分钟的高清视频。
不少行业分析人士指出,这将对广告行业、电影预告片、影视行业带来巨大颠覆。
一些从业者保持冷静:短期内颠覆的速度不一定那么快,更多的是利用新技术激发更多人的创造力。
作者 |黄心怡 2月16日凌晨,OpenAI发布了Vincent视频模型Sora,可以使用文本命令生成1分钟的高清视频。
目前大模型在各个领域的应用主要集中在文森文本和文森图片,但文森视频领域进展缓慢。
文森特视频模型索拉的发布无疑令人兴奋。
不少行业分析人士指出,这将对广告行业、电影预告片、影视行业带来巨大颠覆。
但一些从业者保持冷静:短期内颠覆的速度不一定那么快,更多的是利用新技术激发更多人的创造力。
▌短期内很难产生颠覆性影响。
在官网已更新的48个视频实例中,Sora可以准确呈现视频细节,深入理解现实世界中物体的存在,并生成情感丰富的角色。
例如,一个提示(大型语言模型的提示词)描述了美丽、白雪皑皑、繁华的东京之城。
镜头穿过繁华的城市街道,跟随几个人享受美丽的雪天并在附近的摊位购物。
绚丽的樱花花瓣随着雪花在风中飞舞。
在Sora生成的视频中,镜头从俯瞰白雪覆盖的东京慢慢前进到街上手牵手行走的两个行人。
街上的樱花树、小摊都详细呈现。
不少业内人士认为,这一发展意义难以想象,将对电影、小说、动漫、教育、游戏、自媒体行业产生深远影响。
不过,有视频剪辑从业者却泼了冷水:“大规模应用后是否会产生更多好作品还不清楚,但视频垃圾的产生速度肯定会成倍增长。
”百度产品委员会原主席宋健表示:Sora确实牛逼,但现在认为三年内没人做视频、抖音Tiktok会很快被颠覆还为时过早。

“从平台角度来看,豆快视频号本质上是一个基于视频的社交平台*,甚至视频本身也只是一个形式。
做产品的人一定知道从无到有建立一个社交平台是多么困难。
它需要天时、地利、人和,技术只是变量之一。
此外,生成视频的信息量不如真实镜头。
比如,当一个30岁的男人和一个20岁的女人说话时,表情、语气、表情的背后,是他们积累了50年数据的总和。
这些目前是生成式人工智能无法替代的。
用户对这些细节很敏感。
”宋健认为,如果我们希望利用Sora这种视频生成技术,让视频行业变成“人们纯粹消费机器工业化内容”的局面,这可能行不通。
但如果我们使用新技术,人们而人们能够在企业之间建立新的联系,激活新的创意生产能力是很有趣的,但我们也必须尊重行业的规则,通过“技术”来迭代“生态”,而不是直接将技术强加于用户身上。
缩短实现通用人工智能的时间,集团创始人周鸿祎也表示,今天的Sora可能会给广告业、电影预告片、短视频行业带来巨大的颠覆,但速度可能没有那么快。
“人工智能可能不会那么快颠覆所有行业,但它激发了更多人的创造力,我认为情况并非如此,因为机器可以制作出好的视频,但视频的主题、剧本、镜头策划、台词协调都需要人的创造力,或者至少是提示。
单词。
一段视频或电影是由无数个60秒组成的。
如今Sora可能会给广告业、电影预告片、短视频行业带来巨大颠覆,但不一定能这么快打败TikTok,更有可能成为TikTok的创作工具。
” 周鸿祎认为,大语言模型的强大之处在于,它们能够完全理解世界的知识。
以前所有的文森图片和文森视频都是在 2D 平面上对图形元素进行操作,并没有应用物理定律。
”当时,很多人从技术角度和产品体验来分析Sora,强调它可以输出60秒的视频,保持多个镜头的一致性,模拟自然世界和物理规律。
其实这些都是比较表面的。
最重要的是,Sora的技术思路完全不同。
在Sora生成的视频中,它可以像人类一样理解坦克的冲击力巨大,坦克可以撞车,但不会出现汽车撞坦克的情况。
周鸿祎认为,这也代表了未来的方向。
有了强大的大模型基础,基于对人类语言的理解、对人类知识和世界模型的理解,并加入许多其他技术,就可以创建各个领域的超级工具。
“比如在生物医学蛋白质和基因研究中,包括物理、化学、数学,大型模型都会发挥作用。
这次Sora对物理世界的模拟,至少会对机器人具身智能和自动驾驶产生巨大的影响。
”最初的自动驾驶技术过分强调感知层面,并没有在认知层面发挥作用。
事实上,人们在驾驶汽车时,很多判断都是基于对世界的认知,比如对方的速度有多快。
无论是否会发生碰撞,如果不了解世界,就很难实现真正的自动驾驶。
”周鸿祎预测,Sora的出现可能意味着AGI(人工智能)的实施时间将从10年缩短到1年。
“OpenAI 训练这个模型阅读大量视频。
一旦人工智能连接到摄像头并观看 YouTube 和 TikTok 上的所有电影、视频,对世界的理解将远远超过文本学习。
一张图片一张图片就值得一千个字,一个视频所传达的信息量远远超过了一张图片,这离AGI真的不远了,一两年就可能实现。
多模态大模型将成为生成式AI的重点发展方向,随着Vincent图片和图片对话技术的成熟,Vincent视频已成为多模态大模型下一步发展的重点。
机构业内人士认为,下一步大模型领域的竞争将进一步加剧,多模态大模型将成为生成式AI的重点发展方向,并有望推动本轮AI市场的进一步普及。
。
国盛证券认为,AI文盛视频是多模态应用的下一站。
。
Vincent Video根据给定的文字提示直接生成视频。
随着Vincent Video技术的日益成熟和广泛应用,该技术有望大幅降低短剧制作的复杂度。
成本,为解决“重制作不重创作”的通病,短剧制作重心有望回归高质量剧本创作,中信证券表示,多模态大模式突破算法将带来自动驾驶、机器人等。
随着技术的革命性进步,我们持续看好这一波生成式AI对科技行业的长期影响和变化,持续关注领先的技术算力、算法、数据、应用等方面的厂商。
东吴证券判断,多模态是AI商业野心的起点,有望真正为企业降本增效,企业可以利用节省下来的成本提高产品和服务质量或技术创新进一步提高生产力;与此同时,新的、更大的用户生成内容平台也可能出现。
【本文由投资界合伙人蔡联社授权。
本平台仅提供信息存储服务。
】如有任何疑问,请联系投资界()。
#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,实时传递行业热点新闻、深度评论和前瞻观点帮助企业家掌握新兴技术。
趋势和行业变化,以及对未来技术趋势的洞察。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-17
06-18
06-17
06-17
06-18
06-21
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态