国内自主研发的隐私计算TEE技术通过金融科技产品认证,蚂蚁集团主导研发的
06-18
这几天,作为AI新浪潮的引领者,OpenAI面临着重大的分崩离析危机。
从董事会宣布解雇创始人和CEO萨姆·奥尔特曼,到他的回归被拒绝,期间也经历了多次反转,包括奥尔特曼加入微软、员工迫使公司离开、与Anthropic(克劳德饰)合并等。
北京时间11月22日下午,OpenAI表示原则同意奥特曼回归OpenAI担任CEO并组建新的董事会。
具体细节仍在最后确定中。
在此事正式敲定之前公开披露此事,说明现任董事会也明白OpenAI迫切需要“稳定军心”,否则竞争对手将继续“掏空”OpenAI。
官方宣布后,萨姆·奥尔特曼和刚刚辞职的总裁的格雷格·布罗克曼也发推文暗示OpenAI回归。
不管初衷如何,实际上都起到了“稳定军心”的作用。
OpenAI·总裁 Greg Brockman, Picture/X 根据此前的公开报道,包括在考虑跳槽时,这显然会严重影响OpenAI原本的计划。
与此同时,竞争对手也不仅仅是“看热闹”,他们也希望抓住OpenAI失误的机会,加快创新步伐,加快追赶OpenAI的步伐。
01 Token翻倍,“幻象”减弱,克劳德2.1终于到来。
同一天,从OpenAI分拆出来、得到谷歌支持的Anthropic发布了一款新的聊天机器人——Claude 2.1。
作为ChatGPT最有力的竞争对手之一,Claude 2在上下文长度和语言理解方面已经具备了一定的优势,并且也较早支持了链接和文档阅读功能。
在 Claude 2.1 上,支持的代币数量从 100,000 个增加到 200,000 个,远高于 ChatGPT 的 32,000 个代币。
Token从机器角度就相当于“单词数”。
经常使用 ChatGPT 或类似聊天机器人的读者应该知道,一旦对话长度超过上下文窗口中的 Token 限制,上下文窗口就会发生变化,聊天机器人就会丢失之前对话的内容,相当于忘记了之前的对话内容。
对话背景。
,将直接影响后续的答案。
无需超出Token限制。
只要谈话的长度达到一定阶段,机器就会开始忘记之前的一些背景和要求,需要反复提醒。
20万个Token的长度意味着近一页的文档上下文和更强的“记忆能力”。
换句话说,Claude 2.1 用户现在可以上传整个代码库等技术文档、S-1 等财务报表,甚至《伊利亚特》 或 《奥德赛》 等长篇文学作品。
通过能够与大量内容或数据进行交互,Claude 2.1 理论上可以更好地进行总结、执行问答、预测趋势、比较多个文档等。
AI 企业家兼开发人员 Greg Kamradt 在测试过程中确实注意到 Claude 2.1 的性能提升。
此外,Claude 2.1在对抗大型模型的“错觉”方面也取得了一些进展。
与之前的 Claude 2.0 模型相比,Claude 2.1 的错误陈述概率降低了 2 倍。
图/Anthropic 据Anthropic介绍,他们设置了大量复杂的事实问题进行测试,测试表明,Claude 2.1在面对错误信息和不确定信息时更容易提出反对意见,而不是提供不正确的信息。
例如,反驳用户“玻利维亚人口第五多的城市是蒙特(误传)”的说法,或者承认“我不确定玻利维亚人口第五多的城市是什么”。
这使企业能够构建高性能的人工智能应用程序来解决特定的业务问题,并以更高水平的信任和可靠性在其运营中部署人工智能。
02 Stable Diffusion 视频版发布后开源。
它会再次改变视频生成吗? 文本生成领域有ChatGPT和Claude,图像生成领域有Midjourney和Stable Diffusion,但在视频生成领域仍然没有一个模型能够超越。
这并不是说没有公司在尝试。
谷歌和Meta早已发布了AI生成视频的演示,大量初创团队正在视频生成领域“挖苦”。
例如,Runway先后发布了Gen-1和Gen-2。
生成,从头开始实现真正的视频生成。
当然,Gen-2仍然存在细节模糊、形状扭曲等质量问题,因此始终无法突破。
稳定的视频扩散会改变一切吗? 北京时间11月22日,Stable Diffusion背后的公司Stability AI发布了首个视频生成模型——Stable Video Diffusion。
正如很多人所期望的那样,Stable Video Diffusion 是基于图像生成模型 Stable Diffusion 开发的。
Stability AI已在Github上开源了所有代码,并推出了Hugging Face社区。
图片/Github 值得注意的是,Stable Video Diffusion 目前有两种输出形式,能够以每秒 3 到 30 帧的可定制帧速率生成 14 和 25 帧。
也就是说,Stable Video Diffusion 目前最多只能生成 8 秒左右的低帧率视频。
图片/AssemblyAI 但不要低估开源迭代的力量。
2016年稳定扩散模型首次发布时,图像生成质量不如OpenAI的DALL·E-2。
然而,由于开源策略,Stable Diffusion 已被各种初创公司、开发者和玩家频繁使用和改进。
最终,人工智能生成的图像完全流行起来,引发了一系列的变化。
同时,借助开源力量,Stable Diffusion 模型在不到半年的时间里就迭代到了 2.1 版本。
诚然,Stable Diffusion 的成功或许无法复制,但可以肯定的是,与 Gen-2 等私有模式不同,Stable Video Diffusion 可以聚集开源社区更多的开发力量,加速视频的迭代改进一代模型。
03 生成式人工智能,不仅仅是OpenAI。
11月15日,萨姆·奥尔特曼在被董事会解雇前在X(推特)上表示,由于使用量激增已超过其容量,OpenAI将暂停新的ChatGPT Plus(付费)用户注册。
截至11月22日,OpenAI仍未开放Plus用户注册。
但与此同时,AI时代的浪潮仍在滚滚向前。

除了发布 Claude 2.1 和 Stable Video Diffusion 之外: - Google DeepMind 在最新的音乐生成模型中使用了听不见的“水印”; - 微软发布了规模仅1亿参数的“大型”模型,官方声称其性能优于1亿参数的Meta Llama-2 Chat; - 在下个月举行的 re:Invent 大会上,亚马逊云(AWS)预计也将重点介绍其奥林巴斯大型机型的功能。
今年还有一款可能最受期待的大型机型——Google Gemini。
根据 SemiAnalysis 此前的报道,谷歌下一代大型模型 Gemini 的计算能力高达 GPT-4 的 5 倍。
同时,谷歌自研TPUv5的数量比OpenAI、Meta、Coreweave、甲骨文和亚马逊拥有的GPU数量还要多。
更多的。
在此基础上,Gemini还集成了AlphaGO,它采用强化学习和树搜索,以及机器人、神经科学等领域的技术,拥有语言和视觉两大能力。
OpenAI的首席科学家伊利亚·苏茨克韦尔(Ilya Sutskever)在2010年表示,仅靠文字就可以表达关于世界的大量信息,但它是不完整的,因为我们也生活在视觉世界中。
归根结底,生成式人工智能从来都不是OpenAI一家的公司。
无论围绕OpenAI的“大戏”结局如何,都无法阻挡AI的猛烈浪潮。
【本文由投资界合作伙伴微信公众号授权:雷科技。
本平台仅提供信息存储服务。
】如有任何疑问,请联系投资界()。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-08
06-17
06-17
06-18
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态