首页 > 科技未来 > 内容

Sora在,字节在努力:张楠的重要责任与挑战

发布于:2024-06-18 编辑:匿名 来源:网络

OpenAI再次引起全球关注。

北京时间2月16日,OpenAI发布了文生Sora视频模型。

据官方介绍,Sora可以根据文字提示创建详细的视频,扩展现有视频中的叙事,并从静态图像生成场景。

可以生成长达 60 秒的视频。

这熟悉的场景,让人梦回新的一年。

当时,ChatGPT引发了大模型热潮,掀起了全球AI军备竞赛。

今年,OpenAI再次扔石头,在文生视频池中激起了涟漪。

Sora让“一句话生成视频”成为可能。

这是一场改变视频制作的人工智能革命。

巨头在世界各地的节拍不能忽视这一浪潮。

无独有偶,Sora出柜前一周,字节跳动宣布人事变动。

原集团CEO张楠宣布已辞去集团CEO职务,未来将专注于建盈的发展。

字节跳动CEO梁汝波对张楠过去带领中国信息平台业务做出的贡献和突破表示感谢,并期待她在新的岗位上继续努力。

作为一名老员工,张楠加入字节跳动十年,主导推出了抖音、火山等产品。

她带领抖音超越竞争对手,成为字节跳动第二次跨越的关键人物。

如今,抖音拥有超过6.5亿日活用户,使其成为全球短视频领域的领导者。

高层的变动往往伴随着业务的调整,让最熟悉抖音生态系统的人来负责编辑。

字节跳动的目标非常明确,就是抓住AI文生视频制作的新爆发机会。

据《时代周报》报道,接近电影剪辑的人士透露,过去一年,张楠将大部分精力集中在电影剪辑相关业务上,并亲自带领团队在AI辅助创作上寻求突破,这将是很快就推出了。

人工智能生成的视频产品。

ChatGPT和Sora给字节跳动带来了新的灵感,也带来了更多的压力。

过去一年,字节跳动延续了超级APP的逻辑,推出了多款基于AI技术的产品,涵盖对话、工具、互动剧情等多个品类,其中包括豆宝、按钮等APP。

动作很多,但速度不快,效果也不明显,这让字节跳动感到焦虑。

在年初的内部会议上,梁汝波非常直白地表达了对技术部门的不满。

他表示,字节跳动直到2000年才开始讨论GPT,行业中做得比较好的大型模型初创公司都是2000年到2000年创立的。

在AI的聚光灯下,字节跳动还没有能够创造奇迹,而张楠再次承担起攻击者的角色。

张楠和字节跳动能否带领电影再次创造奇迹,至关重要。

这决定了字节跳动能否走出增长困境,找到新的活力。

Sora来了,字节跳动面临压力 一位时尚女性走在充满温暖霓虹灯和动画城市标志的东京街道上。

她穿着黑色皮夹克、红色连衣裙和黑色靴子,拎着黑色钱包;她戴着墨镜,涂着红色口红;她走起路来自信而随意……潮湿积水的街道,倒映着天空的影像,倒映着女人肌肤上的色彩。

毛孔清晰可见,如此逼真的视频图像是由人工智能生成的。

Sora的示例视频,来源于OpenAI官网。

在没有任何警告的情况下,OpenAI又做出了大动作。

北京时间2月16日,OpenAI在社交平台X发文,首次公布了名为Sora的文生视频AI模型。

Sora带来的震撼不亚于去年的ChatGPT,瞬间成为年初最热门的话题之一。

事实上,文生视频并不是什么新鲜事。

在Sora发布之前,根据知名投资机构a16z的统计,截至年底,市场上公开的AI视频模型有21个,包括大家熟知的Runway、Pika、Genmo、Stable Video Diffusion等。

等等。

但Sora为何如此神奇,以颠覆性的做法再次颠覆AI行业呢? 领悟和还原是Sora意外收获的核心。

OpenAI官网上的多个视频也证明了Sora的能力。

两艘海盗船在一杯咖啡中航行,在泛白的咖啡泡沫中互相厮杀;一列满载乘客的火车穿过光影交替的城市,车窗上投射出车内生动的倒影;一支舞龙队在周围的人群中翩翩起舞。

当你观看并前进时,由远及近的视角充满了现实感。

在视频长度方面,用户只需输入一段文字,Sora就能自动生成长达一分钟的高清视频。

这超过了市场上大多数产品。

据a16z统计,现有AI视频模型制作的视频长度大多在10秒以内。

之前流行的《Runway Gen 2》和《Pika》制作的视频长度分别只有4秒和3秒。

更重要的是,Sora对现实世界的理解和还原能力超过了市场上现有的大型模型。

正如OpenAI在其官方博客中所写,Sora不仅了解用户的需求,还知道这些东西在现实世界中是如何存在的。

具体来说,Sora不仅可以实现一镜到底,还可以完成多角度镜头和分镜头的切换,还可以还原现实世界中的光影反射、人类行为等。

超预期的表现离不开技术支持。

据OpenAI介绍,Sora由于采用了Transformer架构,因此具有极强的可扩展性。

同时,在以往对DALL·E和GPT研究的基础上,还利用DALL·E 3的重述提示词技术进行视觉模型训练。

数据生成高度描述性的注释。

Sora的出现是否会在中国乃至全球掀起新一轮的AI军备竞赛还不得而知,但能生成60s视频的Sora着实给字节跳动带来了压力。

因为60s Video所在的赛道是字节跳动旗舰业务的大本营。

图片来源抖音官网 随着抖音生态越来越丰富,为了服务内容创作者,剪辑也应运而生。

依托抖音的流量池,截至2019年,简影月活跃用户数已突破1亿,成为国内领先的移动视频剪辑产品。

TikTok在全球的火爆也带动了CapCut海外版下载量的激增。

视频编辑之所以如此流行,是因为它降低了门槛,让普通人能够更快、更轻松地制作视频内容。

近两年,随着AIGC的火爆,视频制作的门槛将再次降低。

这也是Sora今天对视频编辑构成威胁的核心原因:更多人会倾向于选择门槛更低但效果更好的平台,而视频编辑的用户可能会被AI视频生成产品抢走。

为了留住用户、抓住新机会,AIGC的布局削减几乎是不可避免的。

2020年11月,Cutting测试了一款名为“Dreamina”的AIGC工具。

用户只需输入一段文字,Dreina就可以生成四张由AI生成的创意图像。

这些图像可以从抽象、写实等多个维度生成,以满足不同用户的审美需求。

当时Tech星球报道称,消息人士透露,该工具未来将用于抖音的图文或短视频的内容创作,丰富抖音的AI创作内容库。

但从效果来看,目前的视频剪辑面临着与Runway、Pika、Genmo等产品同样的困境:视频运动不自然、保真度不高、视角单一。

这些问题本质上都是技术问题。

Sora依赖技术。

解决这些问题不仅威胁着“电影人”的生存,也为“电影人”提供了思路。

今年,抖音集团原CEO张楠辞职,转向电影剪辑发展,足见抖音乃至字节跳动对于AI创作的重视。

值得注意的是,在张楠给编辑的内部信中,张楠提到AI图像生成技术正在给内容创作工具行业带来巨大的变化和可能性。

如今,Sora的异军突起,给字节跳动带来了压力。

它不能再慢下来了。

如何与剑影一起突破,成为张楠新阶段的重要任务。

张楠要为字节跳动再次“开拓新领域”。

入职十年,原抖音集团CEO张楠堪称字节跳动的功臣。

某种程度上,字节跳动业务的快速扩张依赖于张楠。

年初,张楠首先带领团队推出了火山小视频,上线后迅速走红,日活跃用户迅速突破一万;当年,张楠从0到1上线了抖音,成为中国最受欢迎的短视频APP奠定了基础,如今抖音日活用户超过6.5亿。

2019年3月12日,字节跳动成立八周年之际,宣布张楠出任字节跳动(中国)CEO。

作为中国业务总负责人,他将全面协调公司中国业务的产品、运营、市场和内容合作,包括今日头条、抖音、西瓜视频、搜索等业务和产品。

张楠,图片来源字节跳动官网 不久之后,随着字节组织架构的调整,抖音从字节跳动旗下的一个APP成长为生态复杂的抖音集团,旗下拥有抖音、火山、剑影、青眼相机等多个APP,张楠担任抖音集团CEO。

身份的转变让张楠更像是一位在幕后掌控全局的指挥官,而不是冲锋陷阵的将军,但她始终是最了解世界生态的人。

随着市场环境的变化,抖音短视频的增长不如以前是事实,但抖音寻找新的字节增量的目标没有改变。

人工智能的东风越吹越大。

原本是视频创作工具的剑影,站在了最前沿。

这是字节跳动必须抓住的机会。

这个时候,张楠的位置和作用就非常重要了。

最了解抖音的人现在负责编辑。

离开了自己一手带来的抖音,张楠在告别文章中说道,“未来十年我会做一些自己喜欢的事情”。

张楠位置的变化,与其说是她离开权力中心,不如说她被放到了新的关键位置,这也传递出字节跳动要在AI领域突围的信号。

就在张楠辞去CEO职务的前一周,字节CEO梁汝波在字节召开的年度全员大会上发表了题为“永远创业,摆脱平庸的重力”的内部演讲。

在这次分享会上,梁汝波多次提到“危机感”这个词,梁汝波甚至将“强化危机感”列为年度目标。

Sora在,字节在努力:张楠的重要责任与挑战

他坦言,最大的危机感是担心字节跳动作为一个组织正在变得平庸,无法取得新的突破。

字节跳动CEO梁汝波,图片来源字节范儿微信公众号当短视频业务接近天花板时,字节需要寻找新的增长点。

当OpenAI的两颗炸弹证明了AI行业蕴含的想象力时,字节跳动作为一家拥有丰富内容生态和天然AI使用场景的公司,必须跟上AI的步伐,利用AI技术为自己寻找突破口。

“字节跳动是最好的平台,既有梦想,也有务实的浪漫。

我期待和朋友们一起梦想,与这个AI时代一起成长,共同描绘我心中的奇幻世界。

”这是张楠写的。

这个AI梦想不仅属于张楠本人,也承载着字节跳动的希望。

AI时代,字节跳动的全球挑战 如果一家初创公司上半年营收超过腾讯,年初估值达到1亿美元,位列全球独角兽第一,那么这家公司的年度关键词是什么? ? 这不是信心或兴奋。

字节跳动CEO梁汝波给出的答案是危机感。

梁汝波提到,在组织上,字节跳动已经变得平庸:效率低、速度慢、标准低;在人才管理方面,增肥瘦身效果不明显,对高素质人才吸引力较小;业务方面,核心业务不明显。

其他业务也需要突破。

“它不像初创公司那样对机会敏感。

”公司生意的缓慢,加剧了梁汝波的危机感。

跟不上大模型的技术浪潮,是梁汝波感到危机的原因之一。

2016年,OpenAI掀起了“ChatGPT热潮”,也掀起了全球GPT竞赛。

国内外多家知名互联网巨头都推出了自主研发的大模型产品。

回顾字节跳动的动作:2020年1月,组建大型模特团队,将新加坡负责TikTok技术的朱文佳调回国内,担任团队业务负责人; 2019年5月,字节跳动创始人张一鸣忙着研究OpenAI的一系列论文,经常读到深夜。

然而,相比字节跳动此前的战斗力,在新AI时代,字节跳动似乎没能引起轰动。

当其他公司纷纷加入大模型竞争、纷纷推出产品时,字节跳动却在今年8月才推出了自研大模型“云雀大模型”。

此后,字节跳动的AI动作变得迅速而频繁。

首先,AI对话产品“豆宝”上线测试。

它的前身是Byte内部的AI项目,代号为“Grace”。

可以生成歌词、小说、文案等文本内容,还可以提供数学计算、翻译、英语写作等功能;随后,Button、AI角色互动APP“Talk”、AI产品“PicPic”等产品进入内测和研发阶段。

目前,字节已在国内外推出十余款AI产品。

除了上述产品外,还有“AI搜索”、AI情感陪伴聊天机器人“抖音小青”、电商内容创作产品等。

“极创”、AI工具合集ChitChop、AI剧情互动平台BagelBell等,这些产品的背后是一个全新的AI部门Flow,这也是字节在AI时代的领军者。

据36氪了解,Flow部门的技术负责人是字节跳动科技副总裁洪定坤。

一位内部人士告诉36氪,这个新部门的业务负责人是字节大模型团队负责人朱文佳;据Tech星球了解,字节跳动产品与战略副总裁朱军目前负责Flow部门的产品线。

通过召集众多主力,字节发展AI的意图已经非常明显。

然而,尽管在AI方面投入不少,但基于字节的产品想要突破却并不容易。

例如,“豆宝”的上线时间不仅比ChatGPT晚了8个月。

从效果来看,多家媒体评测结果显示,“豆宝”的智能水平相比大型号C端助手产品并无明显优势。

一个明显的变化是,在AI时代,字节跳动仍然处于跟随者的角色,没有弯道超车的迹象。

纵观TikTok的全球发展,面临诸多挑战和竞争。

这种情况下,字节跳动在AI时代尚不具备自己的独特优势,甚至可能被新技术颠覆。

这或许就是梁汝波的危机感所在。

“字节跳动目前的业务有非常大的惯性,即使团队不做出额外的努力,公司仍然可以长期依赖惯性,但这是非常危险的。

”梁汝波提到过。

过去十年,字节跳动抓住了短视频时代的红利,而下一个十年,如何从追随者转变为创造者,保持创业者地位并在AI时代持续突破将考验字节跳动。

正如梁汝波所说,只有保持危机意识和永远的创业心态,字节跳动才能“摆脱平庸的束缚”。

【本文由投资社区合作伙伴微信公众号授权:Insight。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

Sora在,字节在努力:张楠的重要责任与挑战

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 赋比兴完成A+轮千万级融资,4个月内连续完成3轮融资

    赋比兴完成A+轮千万级融资,4个月内连续完成3轮融资

    据投资界(ID:pedaily)4月21日消息,行业级低度发酵酒供应商“赋比兴”已完成最新A+A轮数千万融资。 本轮融资由银河创投领投,宽窄巷子创投等现有股东跟投。 这也是赋比兴在过去四个月内完成的第三轮融资。 目前累计融资金额已达数千万元。 此前,“赋比兴”已完成宽窄巷子

    06-18

  • 欧司朗携手合作伙伴启动 IBELIVE 研究项目,开发微型化光学元件

    欧司朗携手合作伙伴启动 IBELIVE 研究项目,开发微型化光学元件

    2020 年 4 月 18 日,中国上海 - IBELIVE 由德国联邦教育和研究部 (BMBF) 资助,汇聚欧司朗光电半导体等研究人员, Frau 包括埃姆霍夫应用光学与精密工程研究所、TEMICON 和大陆集团在内的研发联盟正在联合开发前瞻性研究项目,用于适用于数据可视化和照明应用的极其紧凑和薄型

    06-06

  • 北京市中小企业公共服务示范平台名单

    北京市中小企业公共服务示范平台名单

    为进一步加强中小企业服务体系建设,根据《北京市中小企业公共服务示范平台管理办法》(京京信发[ 〔〕37号),组织开展北京市中小企业公共服务示范平台(以下简称示范平台)年度绩效评估工作。 北京市中小企业公共服务示范平台名单 返回政策申请页面 #阿里云 #创新创业 #创

    06-18

  • 【清流资本:硬币的另一面】深趋势科技:当我们谈论AI for Science时,我们在谈论什么

    【清流资本:硬币的另一面】深趋势科技:当我们谈论AI for Science时,我们在谈论什么

    编者按:清流资本是普通人眼中的投资“怪物”。 “稳定”、“准确”的资金。 这种“恶魔”印象很可能来自于清流出色的TMT/大消费组合。 但清流资本还有硬币的另一面——同样出色的大型科技投资组合。 我们特别策划了《硬币的另一面》系列专栏,将通过清流与合伙人和CEO的对话

    06-17

  • 2021年新增光伏装机850MW!比利时累计光伏装机量已达7GW!

    2021年新增光伏装机850MW!比利时累计光伏装机量已达7GW!

    根据比利时能源社区协会发布的新数据,比利时去年安装了约MW的新光伏系统,而2018年和2018年的新增光伏装机容量分别为1、1、1、1、1、2兆瓦。 加上去年的新增装机,比利时累计光伏装机容量超过7GW。

    06-08

  • Micro LED 显示技术厂商「麦沄显示」获数千万元 Pre-A 轮融资

    Micro LED 显示技术厂商「麦沄显示」获数千万元 Pre-A 轮融资

    据投资界(ID:pedaily)3 月 14 日消息,据 36Kr 报道,Micro LED 显示技术厂商“麦沄显示”“普显”已完成数千万元Pre-A轮融资。 投资方为融易投资,星涵资本担任独家投资方。 据报道,麦沄显示即将实现Micro-LED产品量产,并已与行业领先客户达成战略合作。 公开资料显示

    06-18

  • Spichi技术分享:车内语音交互的需求与挑战

    Spichi技术分享:车内语音交互的需求与挑战

    对于司机来说,汽车智能最重要的一点是,你可以在驾驶时不用手做一些驾驶以外的操作。 这种行为的实现大多依赖于语音技术的发展。 目前,国内与语音语义相关的公司也注意到了汽车领域的前景,纷纷推出了针对该领域的语音交互解决方案,Spichi就是其中之一。 昨天,Spirit在深

    06-18

  • SOHO中国:黑石同意以30.5亿美元收购SOHO中国

    SOHO中国:黑石同意以30.5亿美元收购SOHO中国

    SOHO中国:黑石同意以30.5亿美元收购SOHO中国,收购价格为每股5港元,总计5800万港元。

    06-17

  • 深圳:构建新能源汽车产业基金体系,完善多元化投融资体系

    深圳:构建新能源汽车产业基金体系,完善多元化投融资体系

    来自投资界的消息(ID:pedaily),11月27日,深圳市八部门联合发布《深圳市促进新能源汽车和智能网联汽车产业高质量发展的若干措施》。 建议加强金融服务支持。 建立汽车消费金融机构,为新能源汽车消费提供专业化、综合化的金融服务。 充分发挥财政资金引导作用,积极吸引

    06-18

  • 装配式建筑云平台“大乐装”完成千万级天使轮融资

    装配式建筑云平台“大乐装”完成千万级天使轮融资

    据悉,大乐装(深圳市大乐装建筑科技有限公司)是重工业互联网装配赛道首家装配式建筑云平台。 今年9月完成数千万天使轮融资,投资方包括东方富海、先锋K2VC等。 本轮融资目的为研发及产业供需链深度改造。

    06-18

  • 深耕3D打印,三迪科技获数千万元B轮融资

    深耕3D打印,三迪科技获数千万元B轮融资

    据投资界7月2日消息,深耕3D打印领域的高新技术企业三迪科技(增材制造)宣布完成数千万元B轮融资。 本轮人民币融资由国家队中金资本领投,南宁高新产业基金、西子资本跟投。 据悉,融资所得公司将用于扩大3D打印规模化应用、获得3D打印康复医疗相关项目的医疗器械资质、提高

    06-18

  • 菲律宾首都重新封城,可能影响三星、村田被动元件出货

    菲律宾首都重新封城,可能影响三星、村田被动元件出货

    为了遏制台达变种毒株蔓延,菲律宾政府近日宣布,首都圈???首都将重新开放城市。 为期两周的居家令将于8月6日起实施。 菲律宾是村田、三星电机等日韩被动元件制造商的生产中心。 受此影响,日本和韩国工厂的出货可能会受到干扰。 据聚恒网了解,菲律宾是日韩被动元件厂商的生

    06-08