首页 > 科技未来 > 内容

Sora不靠蛮力,各大厂商忙着拆盲盒

发布于:2024-06-18 编辑:匿名 来源:网络

春节后的一周,国内人工智能圈和Sora技术相关的各大厂商对OpenAI宣布Sora的反应一致,加上媒体的热情。

形成鲜明的对比。

OpenAI越来越闭源,几乎没有具体信息,国内还处于去盲盒阶段。

不得不承认Sora是算法组合、数据选择、训练策略、算力优化等能力的结合体。

虽然这些技术可能并非OpenAI原创,但OpenAI对其的深刻洞察以及精湛的系统构思和设计能力,只能做出“颠覆性”的突破,而不是简单的蛮力。

面对如此大规模的系统工程,国内人工智能圈仍需在各方面进行弥补。

01 主要厂商反应 本周,字节跳动、百度、阿里巴巴、腾讯、华为、浪潮等公司均未公开发表评论。

一些相关大厂的研发团队正在“拆盲盒”,信息严格保密。

“Sora将会影响公司今年的产品开发计划。

”值得注意的是,各大厂商对Sora的积极关注和洞察程度普遍不如去年ChatGPT推出后那么迫切和深入。

各大工厂的内网上,核心研发团队以外的人都在发表零星的讨论,但“讨论还远谈不上火爆”。

国内各大人工智能大厂的内网上甚至出现“零帖子”。

这种情况与媒体热议甚至中美人工智能差距拉大的感叹完全不同。

不过,一些更快的动作也能看出行业的一些紧迫感。

2月17日,Sora发布的第二天,阿里巴巴社区发起了一篇Sora技术路径分析,文章受到热烈欢迎; 2月18日,百度独学堂推出Sora解读系列课程;春节刚过,浪潮相关业务就给出了Sora的分析报告。

多家主要厂商的相关业务线都安排了调研和报告任务,部分厂商本周将进行Sora分析调查。

由于OpenAI披露的信息很少,与ChatGPT推出后对技术的一些具体分析不同,Sora的分析更多的是猜测,更少的具体依据。

从各大工厂员工的讨论来看,大家都集中在几个方向:Sora的技术机制,包括Sora能否成为现实世界的模拟器;计算能力;商业方向和时间。

目前,其技术机制仍存在诸多“谜团”;对算力消耗的猜测也令人困惑;就Sora的商用时间而言,预测从一个月到半年不等,普遍认为速度会很快。

一家大公司的员工发表了一份分析报告。

从OpenAI的动作来看,包括发布了Sora、ChatGPT、DALLE,以及一直强调的Agent,OpenAI今年下半年可能发布的GPT5将是真正的Agent的第一个版本。

有了这个Agent,比如以后你想做一个App,GPT5可以自动生成代码、图片、视频,打包部署,包括申请和配置域名,最终生成一个可以访问的App。

这些猜测也表明,未来每位员工的工作方式正在被重塑。

虽然大厂论坛上很少有对技术差距的抱怨,但员工们在交流中却有抱怨、无奈。

不过,也有人认为Sora对国内AI超级有利。

原因是,在全球短视频市场中,字节、腾讯、快手占据前三名,而且大家都知道Sora的基础知识。

凭借GPU计算能力,预计“最快一年”就会在中国推出类似产品。

02 OpenAI 不依赖暴力。

业界注意到Sora的惊人成绩得益于新的算法组合和训练策略。

不过,与ChatGPT类似,纯粹从具体算法来看,它们并不是OpenAI原创的。

“Sora在算法组织和数据训练策略上投入了大量精力,充分挖掘算法和数据的潜力,学习更深层次的知识。

”云之声董事长梁家恩表示,通过架构设计和训练策略,而不是单纯的算法改进,OpenAI不断刷新业界的认知。

这体现了OpenAI对算法和数据潜力的深刻洞察,以及成熟的系统构想和设计能力,而不是简单地用“蛮力”来实现这种“颠覆性”突破。

Sora正式公布后,纽约大学的谢赛宁对其进行了技术推测。

由于谢赛宁与Sora团队关系密切,他的猜测影响广泛,尤其是他猜测“Sora参数可能是30亿”。

有人认为30亿这个参数是有道理的。

一位资深人士分析称,Sora生成的视频效果很惊人,但细节也很多。

OpenAI首先要秀肌肉,OpenAI将进一步拓展模型;另一位资深人士从算力的角度直观分析,视频是三维的,单元处理需要大量的算力。

如果Sora参数太大,计算能力会不够。

不过,也有业内人士认为“超过30亿”。

“我认为 30 亿这个参数具有误导性。

一位资深人工智能专家告诉《数字智能前沿》,“Sora 依靠 OpenAI 最强大的语言模型来生成字幕(字幕、说明文字)。

“在Sora提供的技术报告中,简单描述了他们如何为视频设计自动化技术,生成文本描述,或者将简短的用户提示转换为较长的详细描述,以提高视频的整体质量。

而从OpenAI的探索风格来看对于人工智能的边界,也有人认为30亿太小了,“这不符合其一贯做法,他们都讲‘努力才能创造奇迹’。

”中科深圳CTO宋健告诉记者。

数字智能前沿认为,其实这条路已经在理论上被指出了,而且很多企业也已经尝试过。

目前,只有空能够真正实现。

一位浪潮人士表示,Sora的突破再次证明人工智能是一个系统工程,单纯静态地推测参数可能没有意义。

过去大家制作视频的难点就是很难保持视频的连贯性或者一致性,因为中间有很多中间的东西。

反直觉的东西,比如错误的光影、空间变形,所以业界对长视频并不确定。

“OpenAI最终是否会采用更大规模的参数还不能根据目前公开的信息来判断,但我猜他们肯定会根据他们的风格进行尝试。

”梁加恩表示,之前OpenAI从GPT2转向GPT3时,深信只要算法结构合理,通过超大规模无监督学习,可以通过小样本甚至零样本学习击败监督学习这就是OpenAI对规模效应的影响。

”这次Sora通过算法组合和数据设计学到了更多符合物理规律的‘知识’,这符合OpenAI多年来的一贯风格。

“然而,Sora 还不能被称为一个合格的物理世界模拟器,它生成的视频存在大量错误。

OpenAI 本身也在技术报告中提出,这是一个有前途的方向。

人们对 Sora 的需求不同。

” “如果现在做数字孪生,最好直接用物理引擎作为底层来构建,就像英伟达的Omniverse,虽然不是完全物理的,但已经非常准确了。

”宋健说。

但对于视觉艺术来说,它是关于视觉感知的,只要它能够给大家带来足够好的视觉冲击力就可以了。

《03 对计算能力的猜想》现在大家对计算能力的猜测很混乱。

一位NVIDIA人士告诉Digital Intelligence Frontier。

由于OpenAI此次发布的信息很少,业界很难评价。

“视觉模型或多模态模型的计算能力与大型语言模型不同。

”一位人工智能算力资深人士告诉数字智能前沿,尽管Sora可能只有数十亿个参数,但其算力却相当于数千亿。

估计几千亿或者几千亿的大型语言模型也差不多。

为了进一步分析,他可以参考Vincent图模型Stable Diffusion。

参数只有10亿左右,但训练算力却动用了数十台服务器,耗时近一个月。

他估计Sora的训练计算能力可能比前者至少大一个数量级,即数百台服务器,而OpenAI肯定会进一步规模化,让Sora模型变得更大。

另一方面,该模型的推理计算能力远大于大语言。

Sora不靠蛮力,各大厂商忙着拆盲盒

数据显示,Stable Diffusion 的推理算力消耗与 Llama 70b(亿级)参数模型相近。

也就是说,就推理计算能力而言,10亿级的Vincent图模型与1000亿规模的大型语言模型相差无几。

像Sora这样的视频生成模型的推理计算能力肯定比图像生成模型大得多。

“文本是一维的,视频是三维的,视频的单位计算量要大得多。

”一位人工智能专家告诉数字智能前沿,他认为需要几千卡路里才有机会。

由于Sora带动的Vincent Video的发展,今年国内整体算力仍然会非常紧张。

据算力基础设施公司人士介绍,在人工智能算力方面,目前北美几大巨头的算力已经是国内算力总量的十倍以上,甚至更多。

但在某些领域,国内算力已经闲置。

这包括几种情况。

例如,一些去年上半年开始训练大型模型的公司放弃了开发大型模型或转向开源模型;去年大型语言模型的实现遇到了挑战,没有大量的推理应用实现。

这些都会导致一些企业有数十个或数百个闲置单位。

宋健还发现了本地算力闲置的问题。

他观察到,特别是从今年11月份左右开始,租赁算力变得更加容易,价格可能是原价的2/3甚至1/2。

【本文由投资界合作伙伴微信公众号授权:数智前线。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,实时传递行业热点新闻、深度评论和前瞻观点帮助企业家掌握新兴技术。

趋势和行业变化,以及对未来技术趋势的洞察。

Sora不靠蛮力,各大厂商忙着拆盲盒

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 贵阳经济开发区共有6家企业入选贵州省“专精特新”认证名单

    贵阳经济开发区共有6家企业入选贵州省“专精特新”认证名单

    上头条,近日,贵州省工业和信息化厅公布《年贵州省“专精特新”企业认定名单》共有6家企业入选贵阳经济开发区企业入选。 据悉,贵阳经开区新认定的6家企业以先进装备制造企业为主,同时也涉及健康医药、基础材料等领域。 分布于贵阳、铜仁、遵义等城市。 其中包括贵州航天开

    06-18

  • 首富导戏,硝烟暂时消散,跟班从电商公司赚了多少钱?

    首富导戏,硝烟暂时消散,跟班从电商公司赚了多少钱?

    上周二,双11掀起了一日网购狂潮,你参加了吗?不管怎样,果然不出所料,大量网购人数、订单数量、交易金额再次被刷新。 这一天,看完中国首富和风清扬(马云在阿里巴巴内部的昵称)执导的大戏,全国“光棍”们并不孤单,各大卖场、电商都收获颇丰。 天猫“双十一”全天交易额

    06-17

  • 广州200亿资金来了

    广州200亿资金来了

    又是广州。 投资界-解码LP获悉,近日,在第十二届中国(广州)国际金融交流博览会启动仪式上,广州金控集团与广东恒健投资控股有限公司签署《广州市上市公司高质量发展基金战略合作框架协议》协议。 双方将合作在广州设立上市公司。 高质量发展基金,基金目标规模1亿元。 至此

    06-18

  • 魔珐科技宣布连续完成B轮和C轮融资

    魔珐科技宣布连续完成B轮和C轮融资

    投资界(ID:pedaily)4月6日消息,全球元宇宙基础设施建设者领导者魔珐科技宣布连续完成B轮和C轮融资,总金额1.3亿美元。 其中,B轮融资由新鲜资本和金砂资本联合投资,红杉中国和五源资本连续三轮追加投资; 1.1亿美元C轮融资由软银愿景基金二期与知名战略投资机构联合领投

    06-17

  • 马商赢获2000万元A轮融资,猎豹移动领投

    马商赢获2000万元A轮融资,猎豹移动领投

    据投资界1月29日消息,近日,新零售技术提供商马商赢宣布获得2000万元A轮融资。 本轮融资由猎豹移动领投。 其领投,创新工场和58同城跟投。 马尚英创始人对媒体表示,本轮融资将主要用于厂商渠道拓展、技术研发与迭代、优秀人才引进三个方面。   据悉,马尚英在2016年获得

    06-17

  • 一个令人难以置信的想法, 90后卖飞机的小女孩众筹一艘帆船

    一个令人难以置信的想法, 90后卖飞机的小女孩众筹一艘帆船

    几个月前,一名90后女孩通过众筹向一户人家卖了一架价值数万的飞机,引起广泛关注和关注被称为“飞机卖家小女孩”。 。 现在,这个90后女孩又开始发挥想象力了,不过这次众筹的项目不是飞机,而是一艘名为“海上不倒翁”的帆船,可以“征服星星、征服大海”。 说到航海,我总

    06-18

  • 阿里云容器市场份额位列全球前三、中国第一,进入强势者象限

    阿里云容器市场份额位列全球前三、中国第一,进入强势者象限

    近日,全球知名市场研究机构Forrester发布了首份企业级公有云容器平台报告。 其中,阿里云容器服务市场业绩位居全球前三、中国第一。 也取得了中国企业中最好的成绩,进入了表现强劲者象限。 报告显示,阿里云容器服务市场表现位列中国第一,与谷歌云并列全球第三。 分析人士

    06-17

  • 食食宝完成过亿元B轮融资,蔚来资本、五缘资本共同领投

    食食宝完成过亿元B轮融资,蔚来资本、五缘资本共同领投

    11月18日消息,据36氪报道,食食宝完成过亿元B轮融资,蔚来资本领投资本、婺源资本联合领投。 本轮融资将用于技术研发、大数据分析与挖掘、算法设计与应用、市场深度拓展以及人才的持续引进。 宝公司成立于2006年,是汉唐咨询旗下子公司。 石狮宝成立初期,以公司注册产品为切

    06-17

  • 锥智科技完成数千万元Pre-A轮融资,经纬中国领投

    锥智科技完成数千万元Pre-A轮融资,经纬中国领投

    据投资界2月26日消息,锥智科技宣布完成数千万元Pre-A轮融资-A轮融资。 锥智科技专注于生鲜便利及轻餐饮和快消品零售的数字化转型,本轮融资由经纬中国领投,高榕资本等其他投资方。 锥智科技成立于年中,专注于为快消品零售企业提供智能化综合解决方案。 创始团队均具有国内

    06-17

  • 硅基仿生获近5亿元D轮融资,加速血糖管理模式数字化升级

    硅基仿生获近5亿元D轮融资,加速血糖管理模式数字化升级

    据投资界(ID:pedaily)12月21日消息,近日,深圳硅基仿生科技芯科仿生科技股份有限公司(以下简称“芯科仿生”)“基芯仿生”)获得近5亿元D轮融资。 本轮融资由上海生物医药基金和广东省中医健康基金联合领投,兴证资本、嘉诚资本、中国新城等机构参与,方圆资本担任企业

    06-17

  • 智能数据服务运营商“觉飞科技”获数千万元A+轮融资

    智能数据服务运营商“觉飞科技”获数千万元A+轮融资

    近日,智能数据服务运营商“觉飞科技”完成数千万元A+轮融资。 本轮融资由多家战略机构领投,将用于多传感器融合AI技术和车路协同自动驾驶解决方案的研发。

    06-18

  • 两次创业血本无归,数次面临生死关头,这位女子即将IPO

    两次创业血本无归,数次面临生死关头,这位女子即将IPO

    在公众的认知中,物流行业是一个以男性为主导,钢铁和汽油为包围的行业。 女性并不是这个行业的大玩家。 你看,女性CEO更是凤毛麟角,福佑卡车创始人单丹丹就是其中之一,佼佼者。 梅花天使吴世春评价:“单丹丹是物流圈最懂互联网的人,也是互联网圈最懂物流的人。 ” 2008

    06-18