成都银行正式递交IPO申请 拟发行不超8亿股普通股
06-17
OPEN AI再次登陆荧屏。
今年年初,OPEN AI引爆全球科技圈。
因为它发布了一个新的聊天机器人模型——ChatGPT。
与过去那些简单的聊天机器人相比,ChatGPT 不仅可以回答人类问题、承认答案中的错误、拒绝回答不恰当的问题,还可以写诗、编程、论文等,就连马斯克也忍不住感叹: “ChatGPT 好到让人害怕。
我们距离危险的、强大的人工智能已经不远了。
”发布仅两个月后,ChatGPT 的月活跃用户就达到了 1 亿,成为 ChatGPT 的母公司。
OpenAI吸引了微软1亿美元的赌注。
今年年初,类似的故事再次发生。
2月16日凌晨,OpenAI在AI生成视频领域扔出了一颗“王炸”,宣布推出全新生成人工智能模型“Sora”。
在OpenAI官网分享的演示视频中,Sora可以直接输出具有多个角色、多个场景和摄像机运动的图像。
这与一年前 AI 生成的视频相比存在巨大差异,其视频长度“碾压”同行。
据了解,通过文本命令,Sora可以直接输出长达60秒的视频,视频的复杂程度远远超出了大多数人的想象。
这意味着继文本和图像之后,OpenAI将其先进的AI技术扩展到了视频领域。
马斯克还再次评价了OpenAI视频模型:“AI增强的人类将在未来几年创造出最好的作品。
”索拉有什么了不起的? 一方面,这是技术上的突破。
Sora可以生成长达1分钟的超长视频,远远超过Runway-gen2的18秒和Pika的3秒。
更重要的是,与以往AI视频明显的“AI感”相比,Sora制作的视频在保真度和画面精细度上将整个AI视频行业提升到了一个新的水平。
从官网视频来看,人物脸上的痣、痘痘细节、地面水面反射的霓虹光影等几乎都是假的。
也就是说,Sora制作的视频质量,无论是高清还是还原,都是可圈可点的。
另一方面,同样有趣的是空理解长文本的能力。
OpenAI在其官方博客中写道,“Sora不仅可以了解用户的需求,还可以知道这些东西在现实世界中是如何存在的。
“什么意思?只要输入一段文字,Sora就能自动生成一段长达一分钟的高清视频。
神奇的是,Sora不仅能准确掌握用户文字中复杂的含义,还能将其分离出来。
”不同含义的元素,将它们转化为创意十足的视频内容,看起来像是专业导演、摄像师和剪辑师的作品,例如 Sora 的“巧妙构造的珊瑚礁,充满了色彩缤纷的鱼类和海洋生物”。
在以“世界”为主题的视频中,Sora通过其摄像机角度和拍摄时机成功地推进了故事,视频中实际上有多个镜头变化,而无需专门指示它即可自动完成,据内部人士透露,视频是这样生成的。
Sora即使对于头部动画制作公司来说也需要几天的时间才能完成,而Sora只需要几分钟就可以完成,国盛证券认为Sora已经超越了之前其他文盛视频模式作为生产力工具的1分钟长度。
预计将在短视频领域得到广泛应用,扩展视频的能力也有望产生长视频,这可能会带来新一轮的内容创作行业革命,当然OpenAI官网并没有表明这一点。
很难准确模拟复杂场景的物理原理,也可能无法理解因果关系,混淆提示的空间细节。
以DEMO“龙年视频贺年”为例,Sora无法准确生成视频图像。
中文甚至被网友调侃,“难道都是因为中文太难了? “还有视频中老人的生日蛋糕上的蜡烛,但蜡烛火焰的正面却完全没有变化等等。
但OpenAI团队已经让AI从最初的模糊、难以辨别的图像发展到了现在的阶段足以生成长视频,可见其发展很糟糕,B站的一位网友这样评价:“在Sora发布之前,我还在质疑它还能改进多少,OpenAI是否还能继续发展。
”领路,但现在我真的深信不疑了。
比其他厂商的实力强了不止一点点。
一开始就是降维攻击。
Sora 也有一个转换架构。
这不是gpt5的一部分吗?我以前说过gpt5把网上的视频都看了。
以前不信,现在我信了。
”赛事升级对Sora最直接的影响肯定是对视频行业的影响。
Sora作为视频生成工具,可以生成60秒的详细视频,只有文字,这大大降低了视频制作的门槛和成本,特别是对于热点而言,但Sora的更深层次意义在于,这也意味着关于AI的竞争再次升级。
2017年,ChatGPT的发布引领全球进入AI热潮,仅中国企业就发布了100多个大型模型。
最初,大家的目标是开发大型自研模型——富裕的厂商开发基础模型,而初创公司则转向基于开源模型开发行业模型和垂直模型,并添加特定的数据集进行微调。
但事实证明,大型模型的真正门槛在于成本高昂的海量算力、能够提供定制服务的数据服务商以及专业的人才团队。
以计算能力为例。
目前,市面上用于训练大型模型的算力芯片大部分来自NVIDIA。
据财报显示,2019年NVIDIA A的售价大约翻了一番,仅部署一台服务器的电费就高达每月20万元。
大厂商的优势在于,不仅拥有雄厚的财力大规模采购和部署GPU,而且能够及时优化项目、利用大型模型实现效率提升。
据LatePost报道,11月,基于阿里巴巴“统一钱文”,跨境电商AI业务团队正式发布自有产品“Aidge”,具有翻译、营销、设计、本地化服务等一系列功能。
统计显示,11月份AI优化产品收到的海外询盘数量较之前增长了15%。
Byte推出Skylark车型后,陆续开发了豆袋、纽扣、谈话炉等产品。
以聊天炉为例,用户可以通过故事与AI代理一起聊天、创作,获得互动体验。
Sora 使用变压器架构将视频和图像表示为称为补丁的较小数据单元的集合,类似于 GPT 中的令牌。
重要的是,它像GPT一样遵守AI缩放定律,这意味着随着训练计算量的增加,样本质量显着提高。
有业内人士表示,Sora目前尚未开放给公众使用。
只有OpenAI CEO Sam Altman 互动点评,算力已成为大家最关注的资源之一。
2016年,Altman个人投资了AI芯片初创公司Rain Neuromorphics。
2017年,OpenAI花费1万美元购买Rain的芯片;去年11月,奥特曼为一家代号为“Tigris”的芯片公司寻求数十亿美元的融资。
软银集团创始人孙正义正在寻求筹集 1 亿美元资金,以建立一家芯片公司,以补充其半导体设计公司 ARM 的业务。
但空的惊人并不意味着其他人就没有机会。
之前视频生成赛道的明星公司是Runway和Pika。

尽管很多人认为Sora可以轻松降低两者的维度,但Pika创始人郭文晶在回应钛媒体时表示,“我们认为这是一个非常令人兴奋的机会。
据消息透露,我们已经准备好与Sora直接竞争了。
”事实上,OpenAI并非没有竞争对手。
与 Sora 同时发布的还有 Google 的 Gemini 1.5 Pro。
根据官方数据,它支持最多10,000个代币,远远超过当前其他基础型号,并且可以一次处理大量信息,例如1小时的视频、11小时的音频、超过30,000行代码,或者超过700,000字。
Sora固然是OpenAI*的有力证明,但它更像是“力量创造奇迹”的大模型领域竞争升级的信号。
【本文由投资社区合作伙伴微信公众号授权:博湖财经。
本平台仅提供信息存储服务。
】如有任何疑问,请联系投资界()。
#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,实时传递行业热点新闻、深度评论和前瞻观点帮助企业家掌握新兴技术。
趋势和行业变化,以及对未来技术趋势的洞察。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-17
06-18
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态