首页 > 科技未来 > 内容

为什么OpenAI总是领先一个版本

发布于:2024-06-18 编辑:匿名 来源:网络

Sora视频模型的发布几乎复制了一年半前GPT-3首次亮相时AI圈的盛况:突然出现,引发热议广泛的震惊。

北京时间2月16日,在没有任何消息泄露或事先通知的情况下,OpenAI在社交平台X(原Twitter)上发帖,首次公布了名为Sora的文生视频AI模型。

“介绍Sora,我们的文本转视频模型(Introducing Sora, our text-to-video model)”这句话简短而切中要点。

这更像是一个通知,而不是一个公告:是的,我们又拿出了一个大的来了。

之后介绍了Sora模型的能力:Sora可以制作长达60秒的视频,包含高度详细的场景、复杂的镜头动作以及充满活力和情感的多个角色。

还附有演示案例的相应提示:美丽的雪域东京城非常繁华。

镜头穿过熙熙攘攘的城市街道,跟随几个人享受美丽的雪天并在附近的摊位购物。

美丽的樱花花瓣随着雪花在风中飞舞。

对于Sora,业界的评价并不统一:有人认可,也有人认可。

创始人周鸿祎发文称,Sora意味着通用人工智能的实现可能从10年缩短到1年。

这个模型不仅展示了视频制作的能力,也表明大模型理解和模拟现实世界后,会带来新的成果和突破。

NVIDIA 人工智能研究院首席研究科学家 Jim Fan 将Sora称为视频生成领域的 GPT-3 时刻:Sora是一个“数据驱动的物理引擎”、一个可学习的模拟器或“世界模型”。

上网频繁、一向直言不讳的马斯克,直接输入了“gg human”(人类输了)。

我们先不去深究后续的影响是正面的还是负面的。

能够同时给人工智能、影视、社交媒体等多个行业带来颠覆性、划时代轰动的,就是OpenAI。

始终是 OpenAI。

就像一群工程师还在讨论如何进一步完善登月计划一样,OpenAI 团队发回了一组来自火星的自拍照——它们总是有相同的版本,为什么? NVIDIA AI 研究院科学家 Jim Fan 对Sora的评价从技术角度来说非常有启发性:他将Sora定义为物理引擎和世界模型。

传统意义上,视频图像是二维的,而人们生活的物理世界是三维的。

这成为AI视频模型设计之初的概念差异:在生成视频的过程中,AI的作用应该是对多个视频片段进行分割和组合,还是应该作为一个主体来构建和构建记录一个虚拟的AI空间。

OpenAI的选择是后者。

在其官网发布的Sora技术报告中,有一句话值得注意:“我们的研究结果表明,开发能够模拟物理世界动态的通用模拟器是一条有前途的道路,具有前所未有的准确性和真实性。

”粗略的理解是,Sora并不是在剪辑视频,而是在生成视频之前先对一个空间进行建模,然后将其变成一个镜头,记录下三维的虚拟空间。

三维建模可以显示比平面图更多的信息。

在设计思路上,OpenAI提前增加了一个维度,或者说一个版本。

当然,更多的信息意味着更大的数据流。

在有限算力内取得更好的结果,在保证效果的同时尽可能节省算力,本质上是同一个问题:AI计算效率。

但对于OpenAI来说,这些问题都是有经验可循的——从ChatGPT到GPT-4等项目的技术积累,已经成为OpenAI构建Sora模型的良好基础。

受到大语言模型成功案例的启发,OpenAI 在探索视频模型时思考的是“如何获得类似的收益”:在大模型的运行过程中,token(词法单元)作为自然语言处理任务中的最小文本单元,携带输入信息。

该函数帮助模型处理和理解文本。

ChatGPT将代码、数学和各种自然语言拆分为令牌,然后让模型处理和理解令牌,并且可以通过学习令牌之间的关系来获取更多语义信息。

同样,在视频生成模型中,OpenAI 也创建了与 token 对应的数据单元“Patch”(图像单元),并将图形语言转换为对应格式的 patch 进行计算,在保证可扩展性的同时大大提高了单元模型的。

计算能力内的计算效率。

在模型前端,OpenAI也使用了自己在GPT系列模型中的成果:与文本对话类似,训练文生视频的过程不仅需要视频素材案例,还需要大量相应的文本描述。

OpenAI采用最初在DALL·E 3中提出的“重新标题”模式,使用高度描述性的标题生成器为训练集中的视频材料生成文本描述。

生成的结果还表明,在制作过程中向素材添加额外的字幕可以提高整体视频质量,包括准确性。

此外,效仿DALL·E 3的做法,OpenAI还利用GPT扩展了用户输入的简短提示文字,让AI更容易理解,并将用户输入的文字扩展为更长、更详细的描述,然后交给视频生成模型进行处理。

为什么OpenAI总是领先一个版本

对于OpenAI这样的技术驱动型公司来说,经验和技术的积累是一种加速。

可追溯的成功经验和团队自身对AI理念的理解,让OpenAI始终站在自己的肩膀上,或者推动自己加速前进。

比技术创新更可怕,或者说更值得友商关注的是,这种沉迷往往会变成惯性,一步快一步更快。

通过加速追赶和基准测试,我们希望能够与 OpenAI 并驾齐驱。

随着配套设施越来越成熟,难度可能只会增加而不是减少。

真正的增量还是在于顶层设计的创新。

因此,与其说AI占据了人们的创新空间,不如说AI提高了有效创新的门槛:设计AI,或者说能够超越AI创造力的设计,才是大模型时代的有效增量。

【本文由投资界合伙人爱蓝传媒授权发布。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

#阿里云#创新创业#创业支持#创业资讯我们关注国内外最热门的创新创业动态,提供一站式资讯服务,实时传递行业热点新闻、深度评论和前瞻观点帮助企业家掌握新兴技术。

趋势和行业变化,以及对未来技术趋势的洞察。

为什么OpenAI总是领先一个版本

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • AST & Science 完成 1.28 亿美元 B 轮融资

    AST & Science 完成 1.28 亿美元 B 轮融资

    据投资界 3 月 9 日消息,AST & Science 近日完成 1.28 亿美元 B 轮融资。 此轮融资的投资者包括三星创投、乐天创投、沃达丰和 Cisneros。 AST&Science成立于2007年,是一家美国卫星宽带解决方案提供商,将发射数百颗卫星并为用户的智能手机提供网络连接。 除了在自然灾害期

    06-18

  • 中关村论坛聚焦前沿,打造全球科技创新交流合作国家平台

    中关村论坛聚焦前沿,打造全球科技创新交流合作国家平台

    头条新闻,9月24日,中关村论坛正式开幕。 中关村论坛年度主题为“智慧健康碳中和”,聚焦前沿发展技术。 中关村科学城、怀柔科学城、未来科学城、经济技术开发区展位亮相本届论坛科博展馆。 中关村论坛创办于2007年,是全球科技创新交流与合作的国家级平台,以“创新与发展

    06-18

  • 垂直瑜伽工作室SaaS服务商酷瑜完成500万元种子轮融资

    垂直瑜伽工作室SaaS服务商酷瑜完成500万元种子轮融资

    据投资行业消息,瑜伽行业垂直SaaS管理系统品牌酷瑜近日完成1万种子轮融资元。 投资者尚未透露。 酷瑜成立于2018年6月25日,是西安禾碧信息技术有限公司打造的垂直瑜伽行业SaaS管理系统,为瑜伽提供智能、安全、便捷、有效的管理运营推广解决方案通过物联网的工作室。 +AI智能

    06-18

  • AI多链路赋能,加速化工行业数字化转型

    AI多链路赋能,加速化工行业数字化转型

    未来人工智能将在化工行业研发、设计、建设、运营全生命周期发挥什么作用? 化工行业作为流程工业的典型代表,具有系统规模大、涉及专业多、流程复杂、产品多样化、控制难度大、耦合度高等特点。 与人工智能的结合可以鼓励化工企业跳出传统制造业。 ,使化工企业能够在一定的

    06-18

  • 索尼电视2022全系列新品体验:QD-OLED面板电视很香很贵

    索尼电视2022全系列新品体验:QD-OLED面板电视很香很贵

    在参加这次体验会之前,我一直在努力记住索尼电视新品的型号:8K Mini LED华迪系列电视看完Z9K4K迷你LED电视X95EK4K QD-OLED华迪系列电视A95K4K OLED电视A80EK、A80K4K LED液晶电视X90K、X91K后您是否感到困惑?无论如何,我很困惑。 如此怪异的命名可以说是索尼的“传统技艺

    06-21

  • 大战来袭,谁将成为春节黑马?

    大战来袭,谁将成为春节黑马?

    1月31日,春节新片预售正式启动。 据灯塔专业版数据显示,短短4天时间,8部新片总票房(含放映和预售)已突破2亿。 但在内容供给方面,今年的情况与去年有明显不同。 图片来源:灯塔专业版 今年春节期间上映的7部新片涵盖科幻、悬疑、喜剧、动画、体育等多个类别。 今年8部新

    06-18

  • 存储市场进入波动周期,下半年增速将放缓

    存储市场进入波动周期,下半年增速将放缓

    中国电子报 近日,市场研究机构Gartner分析了全球半导体发展现状及趋势。 Gartner研究副总裁盛凌海表示,预计2018年全球半导体收入将增长13.6%,较2018年的26.3%大幅下降,主要是由于存储市场放缓。 盛凌海表示,非存储市场的增长还比较稳定,但整体半导体市场已经进入缓慢增

    06-06

  • 耀铭科技完成数千万元Pre-A轮融资,由海拉(海拉)领投

    耀铭科技完成数千万元Pre-A轮融资,由海拉(海拉)领投

    投资界(ID:pedaily)据6月27日消息,上海耀铭汽车科技有限公司耀明科技股份有限公司(以下简称:耀明科技)完成多轮融资。 Pre-A轮融资1000万元。 本轮由全球领先的一级汽车零部件制造商海拉领投,沂景资本跟投。 本轮资金将主要用于新产品研发、设备购置等工作。 耀明科技

    06-18

  • 清科集团布局资产管理端,携手片仔癀等上市公司持续发力

    清科集团布局资产管理端,携手片仔癀等上市公司持续发力

    7月21日,片仔癀发布公告,宣布联合设立清科-片仔癀医疗并购基金目标规模为5亿元人民币。 。 该基金将直接或间接投资于医疗健康领域相关处于成长期和成熟期的企业,以获得良好的投资回报。 这是清科集团继两个月来与上市公司岭南花园、力思辰合作设立基金后,为上市公司进行产

    06-18

  • 他们在危急情况下奉命连夜奋战3天,他们的AI新方案让火车站无需排队即可测体温!

    他们在危急情况下奉命连夜奋战3天,他们的AI新方案让火车站无需排队即可测体温!

    来自中国各大科技公司的程序员正在利用自己的AI技术奋战在疫情防控第一线。 2月2日,北京北部新综合交通枢纽清河火车站率先落地百度AI多人体温快速检测解决方案,可通过体温计同时检测多人体温。 1分钟内单通道。 乘客几乎不用停下来。 ,避免拥挤。 百度智能云物联网部的这套

    06-18

  • 168万,比亚迪发布电动“保时捷911”

    168万,比亚迪发布电动“保时捷911”

    说到跑车,大多数人的脑海里都会浮现保时捷、法拉利、兰博基尼等世界知名品牌。 这些超级跑车承载着“速度”、“声音”、“激情”等标签,成为了很多男生的梦想。 随着电动化的兴起,超跑领域不再是传统巨头的专属舞台。 中国汽车品牌也推出了Polestar 6、耀明SSR、红旗S9等产

    06-18

  • 企业全面向好,实体机销量10年来首次出现负增长

    企业全面向好,实体机销量10年来首次出现负增长

    企业越来越多地采用云服务,导致实体机销量10年来首次出现负增长。 6月18日,市场研究机构IDC发布了最新数据。 今年一季度,中国市场实体机出货量下降0.7%,全球市场实体机销量下降5.1%。 这背后是企业的全面转移、新旧IT交替的拐点,云计算市场持续强劲增长,平均增速高达40

    06-18