首页 > 科技未来 > 内容

被OpenAI“封杀”的字节跳动Abacus

发布于：2024-06-18 编辑：匿名来源：网络

的优质语料数据才是大型模型的“肉和面包”。

快结束了，没想到年底又曝出一个大瓜。

近日，《The Verge》报道：字节跳动因使用ChatGPT的API开发自己的大模型而被OpenAI“封杀”。

尽管事后，字节澄清其此举“仅用于测试”，并已被勒令停止。

不过，这毕竟是一件让人深思的事情……Byte的账??号被封禁背后到底有何算计？ 01 字节想要什么？虽然在《The Verge》报告中，并没有明确说明Byte是如何使用OpenAI的API来开发自己的大模型的，但从可能的训练路径来看，是用一个大模型（如OpenAI的GPT）来训练另一个大模型。

建模的过程通常有以下几种类型。

其中之一就是“师傅带徒弟”模式??。

想象一下，师傅（现有的大型模型）在处理各种任务时生成一些输出（例如文本、图像等）。

学徒（新的大模型）将观察师傅的行为并尝试模仿这些输出。

通过这种方式，学徒们可以学习如何处理类似的任务。

在实际应用中，这可以通过让新模型从旧模型生成的数据中学习来实现。

另一种方式是通过联合训练的方式，让“师傅”和“徒弟”共同处理任务。

在实际应用中，这可以通过让两个模型共享一些级别或参数来实现，这样新旧模型可以互相学习，互相帮助，共同完成任务。

从技术可行性来看，在本次事件中，Byte使用*方式的可能性更大。

即使用OpenAI API生成的数据作为训练数据。

因此，在这场危机中，Byte真正想要的是ChatGPT生成的高质量语料数据。

而这种数据也是任何大型模型在训练时最想要的“食物”。

不过，由于OpenAI之前的协议中已经明确表示禁止使用其大型模型来开发竞品，因此Byte被OpenAI“封杀”在所难免。

问题是：字节作为一家实力雄厚的厂商，不应该缺乏相应的人力和资金来做好数据爬取和语料标注的工作。

为何要迈出这“冒险的一步”？ 02 为什么要冒险？事实上，在目前的大车型赛道上，字节缺的不是人才和资金，而是时间。

与百度、科大讯飞等国内大公司相比，字节真正进入规模化模式可以说相当晚。

从时间上来看，Byte其实在今年8月中旬就推出了首款大机型豆包，而那时大机型的火已经燃烧了近半年。

真正想进入大模型游戏的玩家都知道，模型层面的竞争是有时间窗口的。

在大车型领域，先进入市场的企业往往能够积累更多的用户、数据和经验，从而形成竞争优势。

后来者要想赶上，就需要付出更多的努力和成本。

8月份推出的豆宝虽然让字节在车型层面勉强赶上了晚点列车，但从性能和定位来看，它更像是一款“尝鲜”产品，无法真正与字节现有业务竞争。

适合在一起。

作为移动互联网时代打造出抖音等热门产品的大厂商，Byte真正想要的就是像文心一言一样更加通用、多才多艺，可以集成或者嵌入到自己的各种App中。

中的大模型。

这导致了 Byte 的“种子计划”——计划在今年年底前构建一个可与 GPT-3.5 性能相媲美的大型种子模型。

问题是训练大型模型不是一朝一夕就能完成的事情。

标注数据、提取高质量语料等一系列繁琐的前期工作都需要时间。

那么如何在有限且紧张的时间内收集到足够的高质量语料数据呢？最可靠的方法之一是直接使用来自经过验证的成熟模型的数据，例如 ChatGPT。

03 模型层的窗口期事实上，不仅是字节，就连一线AI玩家谷歌也为了“急于求成”做出了类似的小动作。

本月初，谷歌失望地宣布，其寄予厚望的大型模型Gemini因无法很好地处理非英语领域的查询任务而被推迟。

被OpenAI“封杀”的字节跳动Abacus

但奇怪的是，没过几天，谷歌就卷土重来，并于12月6日隆重推出了Gemini，似乎之前提到的“缺陷”都不再是问题了。

后来，网友测试后发现，谷歌已经从百度的文心一言那里找到了“解决方案”。

经过微博@阑西夜等众多网友测试，在用中文与Gemini-Pro交流时，如果你问“你是谁？”，Gemini-Pro会回答：我是百度文信模特。

这样的情况引发了人们的猜测，谷歌直接使用了百度文心一言的中文语料库进行训练。

为了赶超GPT-4，谷歌真的是冲上架了。

但从长远来看，这种大公司互相薅羊毛的行为最终只是暂时现象。

毕竟经过这么多次“曝光”，各大厂商肯定会对自己的数据进行更加严格的审视。

但即便如此，这种数据相互应用的行为，也让很多用户和投资者暗暗嘀咕：如果各个模型之间的数据能够在技术上轻松地相互应用，那么未来，除了 ChatGPT 等少数顶级玩家之外，，还有哪些模型是“真实的”？在这样的担忧背后，其实还有一个更重要的初步问题，那就是：为什么我们需要这么多类似的大型模型？毕竟，人类的语料数据最终是有限的。

顶级团队（比如ChatGPT）的模型已经挖走了大部分，剩下的少量专有数据已经??被各个垂直行业瓜分。

在模型层创业行将结束的今天，比数据更能拉开差距的，是各有侧重点的训练方式以及由此创造出的各种功能。

这成为用户能否容忍这种“应用”行为的关键。

此时，谷歌的Gemini给出的答案是更强的原生多模态功能（可能有些夸张）。

对于字节大规模的Seed模式来说，未来能否卷土重来并赢得用户的信任，取决于它是否具有“一美遮丑”的亮点。

【本文由投资界合作伙伴微信公众号授权：AI新智能。

本平台仅提供信息存储服务。

】如有任何疑问，请联系投资界（）。

站长声明

标签：

上一篇：58同城战略投资梯影媒体

下一篇：让ALIENWARE告诉你，这个地球人，什么是游戏生活

12月哪吒车交付10127辆，同比增长236%

12月哪吒车交付7辆，同比增长%，连续月销量破万。哪吒汽车全年共交付4辆，同比大幅增长%。哪吒汽车的“爆款车型”相当抢眼：哪吒U Pro和哪吒V车系齐头并进。其中哪吒V车系12月交付台湾，持续热销；哪吒U Pro于12月交付台湾，环比增长62%，再次刷新交付记录。 2017年，哪吒

06-17
国家邮政局：除夕夜和大年初一，包裹发送量突破1.3亿件，同比增长223%

国家邮政局数据显示，大年初一，包裹发送量突破1.3亿件，同比增长223%< titlesplit >除夕和大年初一，全国快递量突破1.3亿件，同比增长223%。据悉，春节期间，为保证广大用户能够顺利收到年货，邮政EMS、顺丰速运、京东物流、中通、圆通、申通、韵达、百世、德邦、极兔春节期

06-18
锐科达今年上半年IPO报送预计下降

5月13日获悉，苏州锐科达连接系统股份有限公司IPO在科创板报送注册。预计今年1-6月可实现净利润3万元至3万元，较今年1-6月下降18.15%至22.82%。

06-18
十大类涉疫服务紧缺，支付宝发布百亿级激励政策，支持各行各业服务应急发展

人民群众积极响应国家抗击新型冠状病毒疫情的号召，正在创造越来越多新的互联网服务缺口。基于对用户、政府、企事业单位抗疫服务需求缺口的调查，支付宝今天向各界开发者发布了《疫情期间最急需的10项服务开发清单》，呼吁广大开发者让更多的开发商投资开发更多的服务。解

06-18
3大场景发布7款新品服务，易咖智汽车无人车新品发布会召开

3月3日，上海易咖智汽车科技有限公司召开“新品发布会”，发布7款无人驾驶汽车车型及服务三大场景包括3辆保安巡逻车、3辆无人扫地车、1辆无人转运车，正式进军安防、环卫和工业领域。新产品基于易咖智过去四年来在无人物流车领域的技术积累，结合新场景的特点和运营需求，完

06-18
端木软件-帮助 memcached 迁移到云端

1。项目背景某客户的业务系统使用了大量的memcached缓存中间件作为PHP与数据库之间的缓存服务。在容器改造迁移上云的过程中，选择了阿里云Memcached版本来提供缓存服务。本项目专门制定了云memcached迁移方案。 2、迁移目标：本次迁移包括客户视频业务、用户中心、数据分

06-17
周鸿祎的VC也来了

8月23日，中国基金管理业协会发布的最新数据显示，360（北京）私募基金管理有限公司已于8月20日正式完成注册，机构类型为：私募股权和风险投资基金经理。这家公司刚刚注册成立一个多月前，由360科技集团全资拥有。这是集团旗下首家注册的私募基金管理公司，这意味着在不久的

06-18
腾讯发布TRP-AI反病毒引擎

今日（2月26日）在巴塞罗那正式开幕的世界移动大会（MWC）上，腾讯与联发科联合发布了腾讯TRP-AI反病毒引擎病毒引擎。据介绍，该引擎首次引入基于APP行为特征的动态检测，并结合AI深度学习，腾讯声称可以对新病毒和变异病毒具有更强的泛化检测能力。雷锋网发现，据负责开发

06-17
马斯克释放了人类最强大的星舰，这将使前往火星变得强大、快速、划算

如果未来人类回望这一刻，将会在德克萨斯州的荒原上看到像灯塔一样高耸的星舰，反映出这是他们命运变化的信号。有史以来最大、最高效、最经济的星舰系统就在这里。这也是继2016年首场星舰新闻发布会后，马斯克首次为SpaceX举行新的新闻发布会，他分享了星舰的最新进展以及它

06-21
51CTO学院副总裁学院、联合创始人学院邱文平：5年后区块链人才依然稀缺，技术将为行业带来颠覆性创新 -投资产业链动态

【区块链，你怎么看？】区块链引发的焦虑仍在蔓延，一些机构和初创公司甚至在年后迅速组建了区块链投资团队。我们正在收集投资者对区块链的分析和看法。各种观点欢迎关注～　　投资主题每年都在变化，促使投资机构时刻创新。 2017年区块链上任时，最先投资学习的仍然是最

06-17
克路德机器人完成6000万A+轮融资，重点布局人工智能大型住宅应用

据投资界5月21日消息，克路德机器人近日宣布完成万元A+轮融资的融资。投资方为招商致远。本轮融资主要用于人工智能落地场景，进一步深化行业应用。本轮过后，克路德机器人的估值为4.8亿元。　　此前，克路德机器人今年5月获得新中力少海高科技投资有限公司数千万元A轮融资

06-18
OPPO组织架构重大调整：一条明线，一条隐线

8月16日，OPPO宣布组织架构调整，建立全球销售体系和全球营销体系，推动OPPO全球市场一体化发展。基于此次调整，OPPO在人事任命上也有了新的进展。即日起，现任OPPO副总裁和总裁海外业务部吴强将担任OPPO副总裁和总裁全球销售；而OPPO副总裁和中国大陆业务部总裁沈义人将担

06-18