首页 > 科技未来 > 内容

斯坦福团队抄袭清华大模型,作者深夜道歉,中国的大模型已经不能被忽视了

发布于:2024-06-21 编辑:匿名 来源:网络

前段时间,斯坦福大学人工智能研究所(Stanford HAI)发布报告称,美国在大模型领域遥遥领先。

报告指出,2018年有61个知名人工智能模型来自美国机构,远超欧盟的21个和中国的15个。

OpenAI早期投资者维诺德·科斯拉(Vinod Khosla)去年也在X上发表文章称,美国的开源模式将被中国复制。

然而,一直被认为“赶超美国”的国产大模型如今却成为了抄袭的对象,而被抄袭的AI团队正是来自发布上述报告的斯坦福大学。

斯坦福AI团队主导的Llama3-V开源模型被发现涉嫌抄袭清华大学国内开源模型“小钢炮”MiniCPM-Llama3-V 2.5,瞬间在AI圈引起轩然大波。

实锤之下,斯坦福团队也不得不紧急道歉。

正如面壁智能CEO李大海戏称,这是“国际团队认可的方法”。

无论距离顶级大车型有多远,国产大车型已经到了不能再被忽视的地步。

我们简单回顾一下时间线:斯坦福AI团队发布了Llama3-V,被称为SOTA多模态大模型。

网友对这个模型提出了质疑。

国产壁挂式智能手机MiniCPM-Llama3-V2.5抄袭证据浮出水面。

Llama3-V 作者上演了一场“删除数据库然后逃跑”的戏。

面壁智能手机官方深夜发布抄袭声明。

Llama3-V作者正式道歉,网友们纷纷坚决反对抄袭,面对情报“小钢炮”的围墙,斯坦福AI团队上演“删库跑路”。

近日,斯坦福 AI 团队宣布只需要美元就能训练出超越 GPT-4V 的 SOTA 多模态大模型。

但很快,就有X用户@yangzhizheng1指出,该项目使用的模型结构和代码与Wallface Intelligence前不久发布的MiniCPM-Llama3-V2.5惊人地相似。

斯坦福团队抄袭清华大模型,作者深夜道歉,中国的大模型已经不能被忽视了

为此,X用户@yangzhizheng1也发布了相应的质疑证据。

证据一:Llama3-V和MiniCPM-Llama3-V 2.5的模型结构和代码几乎是复制粘贴级别的相似。

不同之处可能是他们换了马甲——变量名变了。

就像同一件衣服,但纽扣颜色不同。

你认为这是巧合吗?证据2:当Llama3-V的作者被问到为什么可以使用尚未提前发布的MinicPM-Llama3-V2.5分词器时,他们解释说他们使用的是wall的上一代MinicPM-V-2 - 面向智能。

项目。

不过,一些媒体寻求 Wallface Intelligence 官员的证实。

在HuggingFace中,MiniCPM-V2和MiniCPM-Llama3-V 2.5分词器分别是两个文件,文件大小完全不同。

此外,MiniCPM-Llama3-V 2.5的tokenizer是由Llama3 tokenizer加上MiniCPM-V系列型号的专用token组成的。

考虑到MiniCPM-V2的发布时间早于Llama3,理论上它不可能包含尚未公开的Llama3分词器技术。

证据三:更离谱的是,作为llama3-V项目负责人的作者,还面临着用户的质疑。

见情况不妙,干脆上演了一出“删库跑路”的好戏。

连GitHub上的项目页面都被删除了,堪称欺骗性的2.0版本。

抱脸的地址如下。

目前,当我们打开页面时,我们只能看到“”。

用户@yangzhizheng1表示,如果在MiniCPM-Llama3-V 2.5的检查点中添加高斯噪声(由单个标量参数化),则所得模型将与Llama3-V同模雕刻。

不仅如此,这个模型还可以识别《清华简》等博大精深的战国古代文字,而且错误一模一样。

用面墙智能官方的话来说:不仅一模一样,而且错误也一模一样。

要知道,这份古文字资料,是清华大学历时数月对收集的清华简进行扫描、手工注释得到的。

它从未被公开过。

那么斯坦福人工智能团队是如何凭空得到它的呢?可以说,Wallface Intelligence 6 月 2 日深夜的声明可以被视为完全抄袭斯坦福 AI 研究团队。

直到今天凌晨,斯坦福 Llama3-V 团队的两名成员 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就此次学术不端行为正式向 MiniCPM 团队道歉,并表示将下架所有 Llama3-V 模型。

名校尖子生也会抄袭吗?中国的大型开源模式正在迎头赶上。

这件事之所以在网络上掀起波澜,一个重要原因就是抄袭作者的背景实在是光荣。

公开资料显示,Siddharth Sharma 和 Aksh Garg 都是斯坦福大学计算机科学系的本科生,发表过多篇机器学习领域的论文。

其中,Siddharth Sharma曾在亚马逊实习过一段时间,目前主要从事AI和数据相关的工作。

Aksh Garg 的实习简历很丰富,涵盖了 SpaceX、斯坦福大学、加州理工学院等知名机构。

至于被作者两位称为“代码搬运工”的穆斯塔法·阿尔贾德里(Mustafa Aljadery),他来自南加州大学。

舆论发酵后,X账号已被设为私人状态。

眼尖的网友并不接受斯坦福Llama3-V团队的道歉声明。

比如,斯坦福AI实验室主任Christopher David Manning用户也站出来谴责这种抄袭行为,并对MiniCPM这个优秀的中国开源模型点赞。

不过,也有网友抱着“随心所欲”的态度,悠闲地鼓励他们:开放和诚实是科技行业非常重要的价值观,期待你的新作品。

谷歌DeepMind研究员Lucas Beyer表示,中国开源的大模型有MiniCPM这样的好模型,但国际社会还没有给予足够的重视……Wall-Facing Intelligence团队昨天也对此事做出了回应。

面墙智能CEO李大海表示:“技术创新并不容易,每一项工作都是团队日夜努力的结果,也是对全球算力有限的技术进步和创新发展的真诚贡献我们希望团队的好作品能够被更多的人关注和认可,但不是这样的。

”面壁智能首席科学家刘志远也在知乎发文称,这一事件从另一个角度证明了中国创新成果的国际影响力,强调了开源共享性、尊重原创精神的重要性。

不得不说,这部AI圈的抄袭剧,是对“创新不易,必须做到并珍惜,学术诚信人人有责”的教科书般的诠释。

事实上,从去年开始,中国的大型开源模型就如雨后春笋般地从受益者转变为贡献者,并且不吝惜提供更多优秀的开源。

从阿里巴巴、腾讯等巨头到面墙智能,智普AI、昆仑天工等AI初创企业也是开源社区的活跃成员,为中国大规模模型的发展做出了贡献。

我们也希望这股开放共享的春风吹得更加强劲。

正如面壁智能CEO李大海呼吁大家共同努力,构建开放、合作、信任的社区环境。

斯坦福团队抄袭清华大模型,作者深夜道歉,中国的大模型已经不能被忽视了

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 科技部火炬中心:推动企业复工复产 确保奖补政策准确及时落实

    科技部火炬中心:推动企业复工复产 确保奖补政策准确及时落实

    3月4日,科技部火炬中心发布《关于做好创业孵化机构科学防疫推进创业企业有序复工复产保持创新创业活力的通知》(以下简称《通知》)。 《通知》强调,当前正处于疫情防控的关键时期。 科技企业孵化器、大学科技园、众创空间等创业孵化机构要坚决贯彻落实习近平关于疫情防控的

    06-17

  • 戴森发布了史上第一款空气净化耳机,这个设计太棒了

    戴森发布了史上第一款空气净化耳机,这个设计太棒了

    今天不是愚人节,但比愚人节更好。 因为刚才——戴森发布了一款耳机。 这款耳机是“耳机+空气净化器”的组合。 不仅支持主动降噪,解决噪音污染;它还支持空气净化,解决空气污染。 一举两得。 你没看错,戴森的第一款“空气净化耳机”来了——一款戴在头上的空气净化器,名为

    06-21

  • 双创科技完成数千万元A2轮融资,昆山高新创投

    双创科技完成数千万元A2轮融资,昆山高新创投

    投资圈(ID:pedaily)12月18日消息,数字孪生技术正逐步从概念走向工业场景应用。 与此同时,国内工业数字孪生行业领军企业“孪生科技”再次成功完成数千万元A2轮融资。 本轮投资由昆山高新创投领投。 这标志着双创科技专注制造领域的战略和潜力得到业界认可,发展进入新阶段

    06-18

  • 商业航天微波遥感综合服务商“英萨科技”获数千万元天使轮投资

    商业航天微波遥感综合服务商“英萨科技”获数千万元天使轮投资

    投资界(ID:pedaily)1月5日报道,英萨科技近期获得数千万元天使轮融资。 本轮融资由苏创投、国发创投、太仓文教投资、苏高科创投共同投资,将用于公司首颗高性能、低成本商用小卫星SAR(合成孔径雷达)孔径雷达)有效载荷产品“雀鹰一号”及一期SAR有效载荷生产基地建设。

    06-18

  • 新华社快看圆桌:快手理想家园春季购房节成交数据已超去年

    新华社快看圆桌:快手理想家园春季购房节成交数据已超去年

    政府工作报告强调要适应新型城镇化发展趋势和房地产供求关系变化市场,加快构建房地产开发新模式。 近日,新华社快看推出“房地产开发新模式对消费者意味着什么?”直播圆桌会议。 并邀请了国家房改工作组原组长、中国房地产集团原董事长孟晓苏、北京房地产经纪行业协会秘书长

    06-17

  • 清明假期银联网上交易额达9036亿元,同比增长3.6%

    清明假期银联网上交易额达9036亿元,同比增长3.6%

    今天,中国银联发布清明假期银联网上交易数据。 清明节三天假期成交金额1亿元,比去年同期增长3.6%。 。 银联数据显示,清明假期三天,餐饮业同比增长9.2%,酒店住宿同比增长7.5%,日用品行业同比增长7.3%同年。

    06-18

  • 教老人用智能手机并不难

    教老人用智能手机并不难

    “打完疫苗、没有手机的半小时里他们在想什么?”前段时间,一段老人坐半小时等待观察期结束的视频,引人发笑。 麦子想到了奶奶。 在她的印象中,奶奶的生活就是一个周而复始的循环:“和家人一起看电视,看电视一两个小时,然后跑到房间睡觉。 醒来后,她在房间的各个角落走

    06-21

  • 搭载展锐Tiger T7520的手机将于明年量产

    搭载展锐Tiger T7520的手机将于明年量产

    Units的新款Tiger T将采用台积电6nm EUV工艺打造。 CPU部分为4核A76核A55,与联发科的天玑/天玑同级别。 是继华为麒麟之后最强的国产手机芯片。 在5G、AI、拍照摄影、续航优化、芯片级安全等方面均达到世界顶尖水平。 据悉,展锐首款基于6nm工艺的5G芯片将于明年量产。 如今紫

    06-06

  • 金融科技公司 Single.Earth 获 790 万美元种子轮融资

    金融科技公司 Single.Earth 获 790 万美元种子轮融资

    投资界(ID:pedaily)7 月 13 日消息,据外媒 TechCrunch 报道,金融科技公司 Single.Earth 近期完成 1 万美元种子轮融资融资由瑞典风投 EQT Ventures 领投,Icebreaker 和 Pipedrive 创始人、RagnarSass和MartinHenk跟投。 该公司将其业务描述为“标记化自然”,将碳信用额

    06-17

  • 科沃斯:一季度净利润4.24亿元,同比增长27.2%

    科沃斯:一季度净利润4.24亿元,同比增长27.2%

    科沃斯披露今年一季报,一季度营业收入32.01亿元,同比-同比增长43.9%;归属于母公司净利润4.24亿元,同比增长27.2%。

    06-18

  • 华为回应造车传闻:重申不造车,帮助车企造好车

    华为回应造车传闻:重申不造车,帮助车企造好车

    对于市场再次流传的造车传闻,华为第一时间表示公司策略不变:华为不造汽车,而是专注ICT技术。 智能汽车增量零部件供应商,帮助车企造好车。

    06-18

  • 高思教育获得华平领投的1.4亿美元D轮融资,并启动B端综合平台战略

    高思教育获得华平领投的1.4亿美元D轮融资,并启动B端综合平台战略

    据投资界4月18日消息,今天下午,一场主题为“感动”的发布会高思教育举办“一起向上”爱学习3.0发布会,高思教育集团创始人与CEO须佶成正式宣布获得由华平投资领投的1.4亿美元D轮融资。 这是K12To B教育领域历史上企业获得的最大一笔融资,也是近年来K12教育企业为数不多的大

    06-17