首页 > 科技未来 > 内容

被OpenAI“封杀”的字节跳动Abacus

发布于:2024-06-18 编辑:匿名 来源:网络

的优质语料数据才是大型模型的“肉和面包”。

快结束了,没想到年底又曝出一个大瓜。

近日,《The Verge》报道:字节跳动因使用ChatGPT的API开发自己的大模型而被OpenAI“封杀”。

尽管事后,字节澄清其此举“仅用于测试”,并已被勒令停止。

不过,这毕竟是一件让人深思的事情……Byte的账??号被封禁背后到底有何算计? 01 字节想要什么? 虽然在《The Verge》报告中,并没有明确说明Byte是如何使用OpenAI的API来开发自己的大模型的,但从可能的训练路径来看,是用一个大模型(如OpenAI的GPT)来训练另一个大模型。

建模的过程通常有以下几种类型。

其中之一就是“师傅带徒弟”模式??。

想象一下,师傅(现有的大型模型)在处理各种任务时生成一些输出(例如文本、图像等)。

学徒(新的大模型)将观察师傅的行为并尝试模仿这些输出。

通过这种方式,学徒们可以学习如何处理类似的任务。

在实际应用中,这可以通过让新模型从旧模型生成的数据中学习来实现。

另一种方式是通过联合训练的方式,让“师傅”和“徒弟”共同处理任务。

在实际应用中,这可以通过让两个模型共享一些级别或参数来实现,这样新旧模型可以互相学习,互相帮助,共同完成任务。

从技术可行性来看,在本次事件中,Byte使用*方式的可能性更大。

即使用OpenAI API生成的数据作为训练数据。

因此,在这场危机中,Byte真正想要的是ChatGPT生成的高质量语料数据。

而这种数据也是任何大型模型在训练时最想要的“食物”。

不过,由于OpenAI之前的协议中已经明确表示禁止使用其大型模型来开发竞品,因此Byte被OpenAI“封杀”在所难免。

问题是:字节作为一家实力雄厚的厂商,不应该缺乏相应的人力和资金来做好数据爬取和语料标注的工作。

为何要迈出这“冒险的一步”? 02 为什么要冒险? 事实上,在目前的大车型赛道上,字节缺的不是人才和资金,而是时间。

与百度、科大讯飞等国内大公司相比,字节真正进入规模化模式可以说相当晚。

从时间上来看,Byte其实在今年8月中旬就推出了首款大机型豆包,而那时大机型的火已经燃烧了近半年。

真正想进入大模型游戏的玩家都知道,模型层面的竞争是有时间窗口的。

在大车型领域,先进入市场的企业往往能够积累更多的用户、数据和经验,从而形成竞争优势。

后来者要想赶上,就需要付出更多的努力和成本。

8月份推出的豆宝虽然让字节在车型层面勉强赶上了晚点列车,但从性能和定位来看,它更像是一款“尝鲜”产品,无法真正与字节现有业务竞争。

适合在一起。

作为移动互联网时代打造出抖音等热门产品的大厂商,Byte真正想要的就是像文心一言一样更加通用、多才多艺,可以集成或者嵌入到自己的各种App中。

中的大模型。

这导致了 Byte 的“种子计划”——计划在今年年底前构建一个可与 GPT-3.5 性能相媲美的大型种子模型。

问题是训练大型模型不是一朝一夕就能完成的事情。

标注数据、提取高质量语料等一系列繁琐的前期工作都需要时间。

那么如何在有限且紧张的时间内收集到足够的高质量语料数据呢? 最可靠的方法之一是直接使用来自经过验证的成熟模型的数据,例如 ChatGPT。

03 模型层的窗口期 事实上,不仅是字节,就连一线AI玩家谷歌也为了“急于求成”做出了类似的小动作。

本月初,谷歌失望地宣布,其寄予厚望的大型模型Gemini因无法很好地处理非英语领域的查询任务而被推迟。

被OpenAI“封杀”的字节跳动Abacus

但奇怪的是,没过几天,谷歌就卷土重来,并于12月6日隆重推出了Gemini,似乎之前提到的“缺陷”都不再是问题了。

后来,网友测试后发现,谷歌已经从百度的文心一言那里找到了“解决方案”。

经过微博@阑西夜等众多网友测试,在用中文与Gemini-Pro交流时,如果你问“你是谁?”,Gemini-Pro会回答:我是百度文信模特。

这样的情况引发了人们的猜测,谷歌直接使用了百度文心一言的中文语料库进行训练。

为了赶超GPT-4,谷歌真的是冲上架了。

但从长远来看,这种大公司互相薅羊毛的行为最终只是暂时现象。

毕竟经过这么多次“曝光”,各大厂商肯定会对自己的数据进行更加严格的审视。

但即便如此,这种数据相互应用的行为,也让很多用户和投资者暗暗嘀咕:如果各个模型之间的数据能够在技术上轻松地相互应用,那么未来,除了 ChatGPT 等少数顶级玩家之外, ,还有哪些模型是“真实的”? 在这样的担忧背后,其实还有一个更重要的初步问题,那就是:为什么我们需要这么多类似的大型模型? 毕竟,人类的语料数据最终是有限的。

顶级团队(比如ChatGPT)的模型已经挖走了大部分,剩下的少量专有数据已经??被各个垂直行业瓜分。

在模型层创业行将结束的今天,比数据更能拉开差距的,是各有侧重点的训练方式以及由此创造出的各种功能。

这成为用户能否容忍这种“应用”行为的关键。

此时,谷歌的Gemini给出的答案是更强的原生多模态功能(可能有些夸张)。

对于字节大规模的Seed模式来说,未来能否卷土重来并赢得用户的信任,取决于它是否具有“一美遮丑”的亮点。

【本文由投资界合作伙伴微信公众号授权:AI新智能。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

被OpenAI“封杀”的字节跳动Abacus

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 12月哪吒车交付10127辆,同比增长236%

    12月哪吒车交付10127辆,同比增长236%

    12月哪吒车交付7辆,同比增长%,连续月销量破万。 哪吒汽车全年共交付4辆,同比大幅增长%。 哪吒汽车的“爆款车型”相当抢眼:哪吒U Pro和哪吒V车系齐头并进。 其中哪吒V车系12月交付台湾,持续热销;哪吒U Pro于12月交付台湾,环比增长62%,再次刷新交付记录。 2017年,哪吒

    06-17

  • 国家邮政局:除夕夜和大年初一,包裹发送量突破1.3亿件,同比增长223%

    国家邮政局:除夕夜和大年初一,包裹发送量突破1.3亿件,同比增长223%

    国家邮政局数据显示,大年初一,包裹发送量突破1.3亿件,同比增长223%< titlesplit >除夕和大年初一,全国快递量突破1.3亿件,同比增长223%。 据悉,春节期间,为保证广大用户能够顺利收到年货,邮政EMS、顺丰速运、京东物流、中通、圆通、申通、韵达、百世、德邦、极兔春节期

    06-18

  • 锐科达今年上半年IPO报送预计下降

    锐科达今年上半年IPO报送预计下降

    5月13日获悉,苏州锐科达连接系统股份有限公司IPO在科创板报送注册。 预计今年1-6月可实现净利润3万元至3万元,较今年1-6月下降18.15%至22.82%。

    06-18

  • 十大类涉疫服务紧缺,支付宝发布百亿级激励政策,支持各行各业服务应急发展

    十大类涉疫服务紧缺,支付宝发布百亿级激励政策,支持各行各业服务应急发展

    人民群众积极响应国家抗击新型冠状病毒疫情的号召,正在创造越来越多新的互联网服务缺口。 基于对用户、政府、企事业单位抗疫服务需求缺口的调查,支付宝今天向各界开发者发布了《疫情期间最急需的10项服务开发清单》,呼吁广大开发者让更多的开发商投资开发更多的服务。 解

    06-18

  • 3大场景发布7款新品服务,易咖智汽车无人车新品发布会召开

    3大场景发布7款新品服务,易咖智汽车无人车新品发布会召开

    3月3日,上海易咖智汽车科技有限公司召开“新品发布会”,发布7款无人驾驶汽车车型及服务三大场景包括3辆保安巡逻车、3辆无人扫地车、1辆无人转运车,正式进军安防、环卫和工业领域。 新产品基于易咖智过去四年来在无人物流车领域的技术积累,结合新场景的特点和运营需求,完

    06-18

  • 端木软件-帮助 memcached 迁移到云端

    端木软件-帮助 memcached 迁移到云端

    1。 项目背景 某客户的业务系统使用了大量的memcached缓存中间件作为PHP与数据库之间的缓存服务。 在容器改造迁移上云的过程中,选择了阿里云Memcached版本来提供缓存服务。 本项目专门制定了云memcached迁移方案。 2、迁移目标:本次迁移包括客户视频业务、用户中心、数据分

    06-17

  • 周鸿祎的VC也来了

    周鸿祎的VC也来了

    8月23日,中国基金管理业协会发布的最新数据显示,360(北京)私募基金管理有限公司已于8月20日正式完成注册,机构类型为:私募股权和风险投资基金经理。 这家公司刚刚注册成立一个多月前,由360科技集团全资拥有。 这是集团旗下首家注册的私募基金管理公司,这意味着在不久的

    06-18

  • 腾讯发布TRP-AI反病毒引擎

    腾讯发布TRP-AI反病毒引擎

    今日(2月26日)在巴塞罗那正式开幕的世界移动大会(MWC)上,腾讯与联发科联合发布了腾讯TRP-AI反病毒引擎病毒引擎。 据介绍,该引擎首次引入基于APP行为特征的动态检测,并结合AI深度学习,腾讯声称可以对新病毒和变异病毒具有更强的泛化检测能力。 雷锋网发现,据负责开发

    06-17

  • 马斯克释放了人类最强大的星舰,这将使前往火星变得强大、快速、划算

    马斯克释放了人类最强大的星舰,这将使前往火星变得强大、快速、划算

    如果未来人类回望这一刻,将会在德克萨斯州的荒原上看到像灯塔一样高耸的星舰,反映出这是他们命运变化的信号。 有史以来最大、最高效、最经济的星舰系统就在这里。 这也是继2016年首场星舰新闻发布会后,马斯克首次为SpaceX举行新的新闻发布会,他分享了星舰的最新进展以及它

    06-21

  • 51CTO学院副总裁学院、联合创始人学院邱文平:5年后区块链人才依然稀缺,技术将为行业带来颠覆性创新 -投资产业链动态

    51CTO学院副总裁学院、联合创始人学院邱文平:5年后区块链人才依然稀缺,技术将为行业带来颠覆性创新 -投资产业链动态

    【区块链,你怎么看? 】区块链引发的焦虑仍在蔓延,一些机构和初创公司甚至在年后迅速组建了区块链投资团队。 我们正在收集投资者对区块链的分析和看法。 各种观点欢迎关注~   投资主题每年都在变化,促使投资机构时刻创新。 2017年区块链上任时,最先投资学习的仍然是最

    06-17

  • 克路德机器人完成6000万A+轮融资,重点布局人工智能大型住宅应用

    克路德机器人完成6000万A+轮融资,重点布局人工智能大型住宅应用

    据投资界5月21日消息,克路德机器人近日宣布完成万元A+轮融资的融资。 投资方为招商致远。 本轮融资主要用于人工智能落地场景,进一步深化行业应用。 本轮过后,克路德机器人的估值为4.8亿元。   此前,克路德机器人今年5月获得新中力少海高科技投资有限公司数千万元A轮融资

    06-18

  • OPPO组织架构重大调整:一条明线,一条隐线

    OPPO组织架构重大调整:一条明线,一条隐线

    8月16日,OPPO宣布组织架构调整,建立全球销售体系和全球营销体系,推动OPPO全球市场一体化发展。 基于此次调整,OPPO在人事任命上也有了新的进展。 即日起,现任OPPO副总裁和总裁海外业务部吴强将担任OPPO副总裁和总裁全球销售;而OPPO副总裁和中国大陆业务部总裁沈义人将担

    06-18