首页 > 科技未来 > 内容

Sora对于国内各大厂商来说是机遇还是挑战?

发布于:2024-06-18 编辑:匿名 来源:网络

??????????????????? 龙年正月,和去年的ChatGPT一样,OpenAI与文森特视频领域的另一位王者——Sora一起开年。

面对这样的AI生成能力,几乎所有类型的从业者都感到了相当的震撼。

一位IT出身的电影制片人告诉绿九商业评论,Sora的惊艳表现让周围的从业者产生了危机感。

电影制作成本大幅下降,崭露头角的电影制片人将比以往任何时候都更容易取得成功。

但在面对《陆九商业评论》提出的“Sora是否具备商业化条件”、“文胜视频是否对算力有更高要求以及如何解决”等疑问时,制作方却用了“开发问题”。

给出了“开发方案”作为回复。

这显然过于乐观。

毕竟更多从业者认为,即使是Sora,从概念到成熟的产业化和商业化,还有很多不成熟的地方。

因此,无论技术路线如何,从实施效果来看单独来说,在通用车型上有相关布局的国内大型模型厂商是否也有同样的“晋级机会”呢?文森视频相比过去的文森视频有哪些实质性的改进?这是一个非常有趣的话题。

0 1 Sora,革命还是泡沫? 必须承认,Sora的出现让通用人工智能(AGI)的实现又近了一步,因为它已经能够模拟真实物理世界的运动,这样。

然而,仅仅这种程度的提升并不算“惊人”,根据OpenAI的官方报告,Sora的“革命性”主要体现在以下几点。

首先是持续时间。

Sora对于国内各大厂商来说是机遇还是挑战?

作为通用的 Vincent 视频模型,它可以根据用户提供的文本描述生成 60 秒的视频。

不仅质量高,而且能够更完整、准确地还原用户输入的提示,即提示词。

其次,是场景复杂度和人物生成水平的突破。

到目前为止,Sora 已经能够生成包含多个角色、特定运动类型以及具有复杂背景细节的精确主题的场景。

而且镜头语言也开始变得复杂,这使得视频本身开始具有一定的叙事功能,而这正是当前短视频领域所需要的。

第三,除了从文本生成视频之外,Sora还可以从静态图像生成动画图像,或者从现有视频生成新视频以填充缺失的帧或扩展视频内容。

一位资深科技媒体人士向鲁九商业评论表示,Sora等AI产品的出现是一个“平等思考”的机会,因为一些长期跟踪行业的科技记者往往会有一些“大创意”的想法,但没有合适的工具来实现这一目标。

但有了GPT、Sora等AI工具,一旦记者看到机会和想法,AI可能会帮助他们实现产品,剩下的就是验证产品的可行性了。

但《绿九商业评论》在与多个行业人士交流后发现,即便是目前取得巨大成功的Sora,估值仍有可能被高估。

星星AI董事长李明顺对此较为理性。

在他看来,Sora的出现很大程度上是文胜文的一般模式,延伸到视频领域的阶段性技术迭代。

Sora目前的质变很大程度上得益于算力和资金的无限投入,再加上海量训练集的持续反复训练。

这就是“努力才能创造奇迹”的结果。

与技术实现上的优势相比,Sora在“资源禀赋”上的优势显然让它距离“算力短缺”的国内厂商更远了。

这是国内大型车型相关厂商长期难以弥合的鸿沟。

从投资角度来看,Sora等垂直领域的“通用车型”并不算是热门标的。

一位一级市场从业者告诉绿九商业评论,纯一级市场投资通常只投资大概念、高估值标的。

主要原因是基金在一级市场存续期为7年,投资期限为2年。

5年后退出是大概率事件。

不过,Vincent Video的垂直模式能否在五年内实现产业化和商业化,谁也无法下定论。

另外,目前的Sora,所有已知信息都是2月15日发布的技术报告,但融资消息却在3天后传出。

在没有开放使用且外界不知道其实际水平的情况下,OpenAI 在风险投资公司 Thrive Capital 领投的融资中估值已逼近 1 亿美元。

一级市场从业者向绿九商业评论坦言,此次技术发布很可能是OpenAI“估值管理”的一部分。

昆仑万维董事长周亚辉在朋友圈表示,“这里(硅谷)的科学家和工程师不认识Open Al以外的创业公司股票的价值,认为都是纸面财富。

”宁愿有 OpenAI、谷歌、FB、微软提供的 10,000 个套餐(一半的股票),也不是初创公司的 10,000 个套餐(80% 的股票)的报价。

”可以看到,继Sora之后,OpenAI进一步拉大了与其他主要AI公司的差距。

0 2 国内大型模型厂商,危险与机遇 尽管Meta、谷歌、微软都蠢蠢欲动,但相比资本市场对Sora的疯狂,国内大型模型厂商却显得冷静得多。

国内大部分主流厂商仍然选择基于自身应用的大模型开发,而不是追求所谓的原生态AI大模型升级。

字节就是其中之一,其对于生成式AI的保守态度早在闻声闻阶段就已经体现出来。

从进入的时间来看,Byte还不算太晚。

据最新报道,今年 6 月 OpenAI 发布 GPT-3 后,字节跳动训练了一个拥有数十亿参数的大型生成语言模型。

如果按部就班地发展,今年Byte和OpenAI的GPT相距不会太远。

只是在ROI主导的业务体系下,字节的投资显然没有得到核算。

因此,其对生成式AI的探索始终慢于竞品。

从发布时间来看,百度文心一言于当年3月发布,并于同年10月迭代至4.0版本,紧随其后的是阿里巴巴的统一千问、腾讯的混元助手、字节发布的云雀大模型将于8月发布。

今年。

发展较晚的后果之一就是用户数量不足——去年文心一言的月活跃用户超过1亿,而字节的豆宝仍低于1000万。

不过,字节任命张楠负责编辑后,预计生成式AI的进展会更快。

如果说字节在文盛视频领域还没有看到任何立即可用的产品,那么百度和阿里巴巴就不能这么说。

早在去年的百度世界大会上,百度就已经展示了文心一言的文声视频能力,主要集成在“易经流影”插件中。

当然,世界大会上出现的生成视频只是易经流影无数抽卡的成功案例。

鲁九商业评论经过测试发现,《易经流影》仍然存在一定的局限性。

一是素材库。

目前,《一镜流影》使用的是无版权的素材库,无法用于特定品牌的工业商业用途。

第二个原因是,出于可能的肖像权考虑,目前无法生成带有肖像的视频,但可以用来生成没有商标的产品视频。

第三,目前生成的视频长度都在30秒左右。

如果想要达到类似Sora的效果,需要拼接两段视频素材。

保持内容和风格的一致显然是困难的。

统一倩文目前采用的是最流行、最流行的相关技术,以国舞王为代表的土生视频技术。

只需拍一张全身照,就可以让它表演各种流行的舞蹈动作。

B站上,慈禧跳科目三等历史人物的二代视频,视频播放量合计约千万。

虽然还没有达到产业化的水平,还没有拉平与国外索拉的差距,但是国外索拉也没有实现产业化,这意味着至少在商业化进程上,两者还没有太大的距离。

剩下的就是追赶的问题了。

星星AI董事长李明顺也持有类似观点。

他告诉绿九商业评论,OpenAI仍然占据行业顶尖位置,但很大程度上是基于之前的算力储备和技术积累。

BAT、字节等国内通用大型车型厂商将继续追赶。

原因很简单。

某种程度上,通用大模型已经成为互联网企业基本能力的象征。

比赛似乎才刚刚开始。

0 3 Vincent Video,真正的赢家在哪里? 当然,无论是OpenAI的Sora还是国内一些大型模型厂商,最终的目标仍然是以工业化、流程化的方式生产高质量的视频内容。

但就目前而言,即使它像Sora一样强大,仍然存在许多不成熟的因素阻碍其在工业领域的应用。

AI动态视频解决方案产品智行源(的产品架构师告诉绿九商业评论,虽然Sora目前看起来很方便,但它可以通过文字直接生成高质量视频,只需要几个提示。

通过文字控制,对用户的心智和操作的负担似乎很小。

不过,由于目前空对现实物理世界的了解还有限,在某些场景下仍然可能会出现问题。

烛光方向的紊乱、精确数量的紊乱、空间物体进出的扭曲等细节,都是后期剪辑中很难改变的。

这并非没有解决办法。

由于Sora目前具备视频扩展和视频拼接功能,用户可以生成几秒的视频以供后期剪辑。

对于提示词工程知识不足的人来说,多次生成+手动后期处理是不可避免的。

另外,在工业产品宣传视频中,客户通常会发布一些新产品,比如新羽绒服、新车、新手机等,但视频模型的训练集中并不存在用户的素材,因此类似只能生成产品,然后再进行加工,这就是影视的后期制作。

专业用户和非专业用户的需求也存在差异。

例如,对于普通轻用户来说,如果没有商业需求,那么该模型就是一个试用产品,任何新生成的作品都会给他们带来惊喜。

但对于专业用户(比如导演)来说,如果一代不够令人满意,就会涉及到多代、多重后期制作流程,这对算力和人力来说都是很大的负担。

前述电影制片人告诉绿九商业评论,在影视制作过程中,后期制作的成本是负责剪辑的,就是二次加工的人力成本。

如果工作流程不够先进,很可能会增加后期制作过程中的成本,从而影响项目的投资回报率。

如果现在的文森特视频还需要大量的手动调整,镜头和物理世界的还原无法做到1:1,那么用AI生成视频素材的成本效益其实并不高。

基于此,一位影视后期从业者向绿九商业评论表示,在他看来,AI能直接替代的其实是搭建、拍摄等中期工作。

因为AI模拟并还原了物理世界,通过不断的训练可以接近真实水平。

以上只是Sora对影视行业的一些改变。

至于游戏、广告、创作等细分领域,变化肯定远远大于问题。

人工智能的应用及其革命性的变化无疑是宏伟的。

国内各大厂商显然更愿意在AI应用的商业探索上做出努力和尝试。

同样,根据周亚辉的朋友圈剧透,“Open AI 即将发布 GPT4.5,估计会刻意选择在 Anthropic 发布 Claude 3 时发布。

”除了Sora的生成视频之外,Open AI的最新迭代还有哪些惊人的创新,应该是国内各大厂商从事大模型策略和业务部门最关心的问题。

最后,对于文胜视频来说,是基于+AI来应用大模型,还是基于AI+来训练和升级自己原有的大模型。

显然,美国大企业和中国大企业分别做出了自己的选择。

【本文由投资伙伴鲁九金融授权。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,实时传递行业热点新闻、深度评论和前瞻观点帮助企业家掌握新兴技术。

趋势和行业变化,以及对未来技术趋势的洞察。

Sora对于国内各大厂商来说是机遇还是挑战?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • “失物追踪”专家Tile被收购,曾批评苹果不公平竞争

    “失物追踪”专家Tile被收购,曾批评苹果不公平竞争

    近日,与苹果AirTag竞争的蓝牙追踪器品牌Tile被家庭通信服务商Life以2.05亿美元收购。 该交易预计将于今年第一季度完成。 从双方的定位和产品来看,这是一次互补、各取所需的收购。 Life Location是一款综合性家庭安全应用,提供位置共享、碰撞检测等功能。 其估值已超过10亿

    06-21

  • Strategy Analytics:2020年第四季度需求强劲,全球智能音箱销量突破1.5亿台

    Strategy Analytics:2020年第四季度需求强劲,全球智能音箱销量突破1.5亿台

    Strategy Analytics近期发布的研究报告显示,尽管Covid-19疫情给市场带来挑战,但全球智能音箱销量仍处于领先地位。 2020年智能音箱销量达到1.5亿台,达到历史最高水平,突破1.5亿台。 苹果、亚马逊、谷歌、阿里巴巴和百度的新机型正赶上最重要的圣诞销售季,为艰难的一年画上

    06-18

  • 每秒帧MediaTrack获得数百万美元Pre-A轮融资,由纪源资本领投,

    每秒帧MediaTrack获得数百万美元Pre-A轮融资,由纪源资本领投,

    投资社区(ID:pedaily)1月25日消息,据36氪报道,基于云原生的音视频协作工具平台MediaTrack获得数百万美元Pre-A轮融资。 本轮由纪源资本领投,天使投资人GFC跟投,元和资本参投财务顾问。 通过云原生音视频制作协作工具,分钟帧让创作者、制作者和客户通过云端同步,实现跨

    06-17

  • 心脉医疗今年一季度营收1.97亿元,利润1.02亿元

    心脉医疗今年一季度营收1.97亿元,利润1.02亿元

    科创板上市公司心脉医疗(16.SH)今年一季度实现营收1.97亿元一季度同比增长99.07%;上市公司股东净利润1.02亿元,同比增长70.96%。

    06-18

  • 三星5nm工艺又多了一个客户,谷歌Pixel 6系列有望搭载

    三星5nm工艺又多了一个客户,谷歌Pixel 6系列有望搭载

    知名消费电子爆料达人Jon Prosser近日透露了谷歌新手机Pixel 6系列的部分规格。 它将搭载采用三星5nm工艺的谷歌自研芯片,取代此前使用的高通处理器。 该芯片由谷歌和三星半导体部门联合开发,其性能可与高端Passenger S车型相媲美。 长期以来,一直有传言称谷歌将开发自己的

    06-08

  • GPU分布式通信技术简析——PCle、NVLink、NVSwitch

    GPU分布式通信技术简析——PCle、NVLink、NVSwitch

    本指南深入探讨了GPU分布式通信技术的复杂性,特别是在大规模AI模型时代至关重要的PCIe、NVLink和NVSwitch。 它解决了训练超出单个 GPU 内存限制且必须同时使用多个 GPU 的大型模型的挑战。 该内容重点探讨了数据并行性,这是一种跨多个 GPU 分配数据以并行处理和加速训练的

    06-17

  • QQ浏览器奖励正版小说用户500万,网络文学“正版化”加速

    QQ浏览器奖励正版小说用户500万,网络文学“正版化”加速

    当前,正版网络文学产业建设在阅文集团主导的正版联盟全力推动下快速推进,而各大平台正以积极的态度快速跟进并采取措施打击盗版,为网络文学行业健康快速发展提供助力。 继UC、百度等平台相继斩断“盗版”行动后,QQ浏览器近日推出“小说阅读季”正版文学活动,宣布将投入1万

    06-18

  • 东莞天使基金顺利完成注册

    东莞天使基金顺利完成注册

    投资圈(ID:pedaily)4月25日消息:近日,由东莞市科技局与东莞市科创金融集团共同发起设立的东莞天使基金,在中国基金会协会注册成功完成(备案代码:SAHS99),标志着基金正式启动运营。 3月1日,东莞天使母基金在松山湖隆重启动,来自全国及港澳地区的百余家投资机构代表

    06-18

  • 苹果前高管加盟微软,负责混合现实硬件研究

    苹果前高管加盟微软,负责混合现实硬件研究

    雷锋网注:图片来源LinkedIn 据外媒报道,苹果前高管RubnCaballero已加盟微软,负责混合现实硬件和人工智能技术。 HoloLens混合现实耳机等硬件的研究。 LinkedIn界面显示,Rubn和Caballero已于今年3月加入微软。 在加入微软之前,Rubn在苹果公司工作了14年(2019年1月至2019年

    06-18

  • “深圳深研生物科技”完成超3亿元B+轮融资,越秀产业基金领投

    “深圳深研生物科技”完成超3亿元B+轮融资,越秀产业基金领投

    据投资界(ID:pedaily)2月21日消息,近日,深圳市深研生物科技有限公司完成了超3亿元B+轮融资,越秀产业基金领投。 深圳市深研生物科技有限公司(以下简称“深研生物”)宣布完成超3亿元B+轮融资。 本轮融资由越秀产业基金领投,大辰跟投财智、悦客金融、天士力资本、亚商

    06-17

  • 后PC时代的尴尬:神舟电脑谋求上市,PC厂商谋转型

    后PC时代的尴尬:神舟电脑谋求上市,PC厂商谋转型

    神舟电脑绝对是PC行业的传奇:低价策略席卷PC市场;董事长个人持有90%以上股份;以及愈挫愈勇的四份清单。   据悉,神舟电脑将于9月冲击上交所主板。 此前,神舟电脑曾3次在资本市场失败。 3月22日,神舟电脑第三次上市计划落空。 业内人士分析说,董事长和吴海军的统治是一

    06-18

  • 天上的富贵终于轮到尔滨了,

    天上的富贵终于轮到尔滨了,

    天上的财富终于轮到尔滨了。 往年的寒冬,笼罩着被敲诈印象的东北白雪皑皑的乡村,是游客不敢回避的地方,而三亚则是最爱。 今年,游客的交通由北转向南。 东北老牌网红哈尔滨在元旦假期通过旅游赚了59亿元,已经展现了当年顶级城市的地位。 老哈忙着迎宾、招待客人,而老吉、

    06-18