首页 > 科技未来 > 内容

被OpenAI“封杀”的字节跳动Abacus

发布于:2024-06-18 编辑:匿名 来源:网络

的优质语料数据才是大型模型的“肉和面包”。

快结束了,没想到年底又曝出一个大瓜。

近日,《The Verge》报道:字节跳动因使用ChatGPT的API开发自己的大模型而被OpenAI“封杀”。

尽管事后,字节澄清其此举“仅用于测试”,并已被勒令停止。

不过,这毕竟是一件让人深思的事情……Byte的账??号被封禁背后到底有何算计? 01 字节想要什么? 虽然在《The Verge》报告中,并没有明确说明Byte是如何使用OpenAI的API来开发自己的大模型的,但从可能的训练路径来看,是用一个大模型(如OpenAI的GPT)来训练另一个大模型。

建模的过程通常有以下几种类型。

其中之一就是“师傅带徒弟”模式??。

想象一下,师傅(现有的大型模型)在处理各种任务时生成一些输出(例如文本、图像等)。

学徒(新的大模型)将观察师傅的行为并尝试模仿这些输出。

通过这种方式,学徒们可以学习如何处理类似的任务。

在实际应用中,这可以通过让新模型从旧模型生成的数据中学习来实现。

另一种方式是通过联合训练的方式,让“师傅”和“徒弟”共同处理任务。

在实际应用中,这可以通过让两个模型共享一些级别或参数来实现,这样新旧模型可以互相学习,互相帮助,共同完成任务。

从技术可行性来看,在本次事件中,Byte使用*方式的可能性更大。

即使用OpenAI API生成的数据作为训练数据。

因此,在这场危机中,Byte真正想要的是ChatGPT生成的高质量语料数据。

而这种数据也是任何大型模型在训练时最想要的“食物”。

不过,由于OpenAI之前的协议中已经明确表示禁止使用其大型模型来开发竞品,因此Byte被OpenAI“封杀”在所难免。

问题是:字节作为一家实力雄厚的厂商,不应该缺乏相应的人力和资金来做好数据爬取和语料标注的工作。

为何要迈出这“冒险的一步”? 02 为什么要冒险? 事实上,在目前的大车型赛道上,字节缺的不是人才和资金,而是时间。

与百度、科大讯飞等国内大公司相比,字节真正进入规模化模式可以说相当晚。

从时间上来看,Byte其实在今年8月中旬就推出了首款大机型豆包,而那时大机型的火已经燃烧了近半年。

真正想进入大模型游戏的玩家都知道,模型层面的竞争是有时间窗口的。

在大车型领域,先进入市场的企业往往能够积累更多的用户、数据和经验,从而形成竞争优势。

后来者要想赶上,就需要付出更多的努力和成本。

8月份推出的豆宝虽然让字节在车型层面勉强赶上了晚点列车,但从性能和定位来看,它更像是一款“尝鲜”产品,无法真正与字节现有业务竞争。

适合在一起。

作为移动互联网时代打造出抖音等热门产品的大厂商,Byte真正想要的就是像文心一言一样更加通用、多才多艺,可以集成或者嵌入到自己的各种App中。

中的大模型。

这导致了 Byte 的“种子计划”——计划在今年年底前构建一个可与 GPT-3.5 性能相媲美的大型种子模型。

问题是训练大型模型不是一朝一夕就能完成的事情。

标注数据、提取高质量语料等一系列繁琐的前期工作都需要时间。

那么如何在有限且紧张的时间内收集到足够的高质量语料数据呢? 最可靠的方法之一是直接使用来自经过验证的成熟模型的数据,例如 ChatGPT。

03 模型层的窗口期 事实上,不仅是字节,就连一线AI玩家谷歌也为了“急于求成”做出了类似的小动作。

本月初,谷歌失望地宣布,其寄予厚望的大型模型Gemini因无法很好地处理非英语领域的查询任务而被推迟。

被OpenAI“封杀”的字节跳动Abacus

但奇怪的是,没过几天,谷歌就卷土重来,并于12月6日隆重推出了Gemini,似乎之前提到的“缺陷”都不再是问题了。

后来,网友测试后发现,谷歌已经从百度的文心一言那里找到了“解决方案”。

经过微博@阑西夜等众多网友测试,在用中文与Gemini-Pro交流时,如果你问“你是谁?”,Gemini-Pro会回答:我是百度文信模特。

这样的情况引发了人们的猜测,谷歌直接使用了百度文心一言的中文语料库进行训练。

为了赶超GPT-4,谷歌真的是冲上架了。

但从长远来看,这种大公司互相薅羊毛的行为最终只是暂时现象。

毕竟经过这么多次“曝光”,各大厂商肯定会对自己的数据进行更加严格的审视。

但即便如此,这种数据相互应用的行为,也让很多用户和投资者暗暗嘀咕:如果各个模型之间的数据能够在技术上轻松地相互应用,那么未来,除了 ChatGPT 等少数顶级玩家之外, ,还有哪些模型是“真实的”? 在这样的担忧背后,其实还有一个更重要的初步问题,那就是:为什么我们需要这么多类似的大型模型? 毕竟,人类的语料数据最终是有限的。

顶级团队(比如ChatGPT)的模型已经挖走了大部分,剩下的少量专有数据已经??被各个垂直行业瓜分。

在模型层创业行将结束的今天,比数据更能拉开差距的,是各有侧重点的训练方式以及由此创造出的各种功能。

这成为用户能否容忍这种“应用”行为的关键。

此时,谷歌的Gemini给出的答案是更强的原生多模态功能(可能有些夸张)。

对于字节大规模的Seed模式来说,未来能否卷土重来并赢得用户的信任,取决于它是否具有“一美遮丑”的亮点。

【本文由投资界合作伙伴微信公众号授权:AI新智能。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

被OpenAI“封杀”的字节跳动Abacus

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 性能拖累?科创板上市三天,生益电子股价显疲态

    性能拖累?科创板上市三天,生益电子股价显疲态

    生益电子全年实现营业收入36.34亿元,同比增长17.35%;实现利润总额4.97亿元,同比下降1.85%;实现归属于母公司所有者的净利润4.39亿元,同比下降0.44%。 听,中小企业反馈平台。 倾听用户需求,倾听创业者声音,解决中小企业痛点。 点击立即参与调查并获得礼物。

    06-17

  • 纪源资本完成首支人民币15亿元基金募资,管理总规模超40亿美元

    纪源资本完成首支人民币15亿元基金募资,管理总规模超40亿美元

    据投资界5月3日消息,今日,纪源资本宣布完成首支基金募资,总管理规模超40亿美元。 人民币基金。 该基金最终募集规模超过15亿元人民币。 将重点投资:互联网服务、消费升级、前沿技术和智能硬件、企业服务、数字服务等领域中国领先的初创和成长期企业。   据悉,纪源资本首

    06-17

  • 中信投资旗下烟台芝罘城市发展母基金成功设立,基金规模50亿元

    中信投资旗下烟台芝罘城市发展母基金成功设立,基金规模50亿元

    据投资界(ID:pedaily)2月15日消息,近日,中信建投资本烟台智富金融控股集团联合发起设立烟台智富城市发展母基金合伙企业(有限合伙)(以下简称“智富母基金”)管理有限公司(以下简称“中信建投”)智富金融股份有限公司(以下简称“智富金融”)投资于中国证券基金业协

    06-18

  • 北京发布创业补贴政策:北京居民或需拉动就业

    北京发布创业补贴政策:北京居民或需拉动就业

    近日,北京市人力资源和社会保障局、北京市财政局宣布《关于开展一次性创业补贴工作的通知》支持重点群体利用企业带动就业。 符合条件的创业组织可享受一次性补贴1000元。 此外,每聘用一个在本市登记的劳动力,还将再获得一份补贴。 《通知》很明显,补贴针对的是两类人群。

    06-17

  • Sirnaic Pharmaceuticals 完成 C2 轮融资 2200 万美元,使 C 轮融资总额达到 4700 万美元

    Sirnaic Pharmaceuticals 完成 C2 轮融资 2200 万美元,使 C 轮融资总额达到 4700 万美元

    据投资界 4 月 28 日消息,Sirnaic Pharmaceuticals 近日完成 C2 轮 10,000 美元融资。 本次C2轮投资由华润正大生命科学基金领投,上海富益资本、深圳滚石资本参与B轮投资,美国Skyrim Legend投资跟投。 此前,思诺组学还于今年6月获得超万美元(1.6亿元人民币)C1轮融资,由

    06-18

  • 宁德时代斥资近6亿元,又投资两只基金

    宁德时代斥资近6亿元,又投资两只基金

    锂电池龙头企业宁德时代再次以LP身份亮相。 据投资界10月12日消息,宁德时代11日发布一系列公告。 公司认缴出资2亿元,参与投资青岛银山创业投资基金合伙企业(有限合伙),持有基金认购比例42.55%;认购人民币3亿元参与投资厦门银山股权投资合伙企业(有限合伙),持有该基金

    06-18

  • 中银科技完成1亿元A轮融资,由龙磐资本领投

    中银科技完成1亿元A轮融资,由龙磐资本领投

    投资社区(ID:pedaily)3月30日消息,中银科技近日完成1亿元A轮融资,本次融资由龙磐资本领投由龙磐资本盈科资本、华谊资本、君慈投资共同参与投资,WinX Capital担任财务顾问。 此前,禾堂创投、未都创投、龙门资本等共同参与完成了中银科技的PreA、PreA+轮融资。 本轮募集

    06-18

  • 大师熊完成数千万元A轮融资,清科创投领投

    大师熊完成数千万元A轮融资,清科创投领投

    据投资界4月29日消息,大师熊已完成数千万元A轮融资。 本轮融资由青岛创投领投。 科学创投领投,老股东蓝海中利也参与投资。 三江源资本为本轮融资,天使轮机构为浩方创投。 大师熊创始人陈永清表示,“本轮融资主要用于市场开拓、系统功能完善和供应链平台建设。 ”据了解,

    06-18

  • 互联网珠宝品牌Gemist完成种子轮融资

    互联网珠宝品牌Gemist完成种子轮融资

    据投资界7月20日消息,美国互联网珠宝品牌Gemist近日宣布完成种子轮融资,由钻石巨头戴比尔斯(戴比尔斯)投资),但尚未公布。 具体的财务细节。 公开资料显示,Gemist由Madeline Fraser于2007年创立,采用直销模式。 该品牌最独特的地方在于,用户可以通过Gemist的移动应用

    06-18

  • 线上创业大赛让“互害”

    线上创业大赛让“互害”

    全球智能硬件孵化基地携手中国第一智能硬件媒体打造3小时线上创业大赛7月30日19:00-22:00赛格创客空间&雷峰网赛格创业大赛第二季初赛组▼前三名:每人一张CCF-GAIR会议门票(价值人民币)前五名(含前三名):免费体验赛格创客空间会员区一个月十强(含前五名):免费参加年度

    06-17

  • 如果日本向太平洋排放123万吨核废水,中国将受到怎样的影响?

    如果日本向太平洋排放123万吨核废水,中国将受到怎样的影响?

    据日本媒体报道,日本政府计划将1万吨福岛核泄漏核废水排入太平洋,并将在今年10月的内阁会议上尽快敲定。 面对世界各国特别是周边国家的谴责,日本首相菅义伟表示:“(日本)政府将尽快承担责任,敲定处置政策。 ”日本表示,将核废水排放到太平洋是“被迫别无选择”。 选择。

    06-21

  • 日月光半导体上海有限公司接受券商辅导拟在境内A股IPO

    日月光半导体上海有限公司接受券商辅导拟在境内A股IPO

    日月光半导体(上海)有限公司周四在中国证券报上发布公告称,拟进行境内A股IPO A股首次公开发行(IPO)并上市。 目前正在接受长城证券指引。   公告称,公司发起人为ASE MAURITIUS INC、日月光电子元件(上海)有限公司、日月光封装测试(上海)有限公司,共3名股东。  

    06-17