首页 > 科技未来 > 内容

斯坦福团队抄袭清华大模型，作者深夜道歉，中国的大模型已经不能被忽视了

发布于：2024-06-21 编辑：匿名来源：网络

前段时间，斯坦福大学人工智能研究所（Stanford HAI）发布报告称，美国在大模型领域遥遥领先。

报告指出，2018年有61个知名人工智能模型来自美国机构，远超欧盟的21个和中国的15个。

OpenAI早期投资者维诺德·科斯拉(Vinod Khosla)去年也在X上发表文章称，美国的开源模式将被中国复制。

然而，一直被认为“赶超美国”的国产大模型如今却成为了抄袭的对象，而被抄袭的AI团队正是来自发布上述报告的斯坦福大学。

斯坦福AI团队主导的Llama3-V开源模型被发现涉嫌抄袭清华大学国内开源模型“小钢炮”MiniCPM-Llama3-V 2.5，瞬间在AI圈引起轩然大波。

实锤之下，斯坦福团队也不得不紧急道歉。

正如面壁智能CEO李大海戏称，这是“国际团队认可的方法”。

无论距离顶级大车型有多远，国产大车型已经到了不能再被忽视的地步。

我们简单回顾一下时间线：斯坦福AI团队发布了Llama3-V，被称为SOTA多模态大模型。

网友对这个模型提出了质疑。

国产壁挂式智能手机MiniCPM-Llama3-V2.5抄袭证据浮出水面。

Llama3-V 作者上演了一场“删除数据库然后逃跑”的戏。

面壁智能手机官方深夜发布抄袭声明。

Llama3-V作者正式道歉，网友们纷纷坚决反对抄袭，面对情报“小钢炮”的围墙，斯坦福AI团队上演“删库跑路”。

近日，斯坦福 AI 团队宣布只需要美元就能训练出超越 GPT-4V 的 SOTA 多模态大模型。

但很快，就有X用户@yangzhizheng1指出，该项目使用的模型结构和代码与Wallface Intelligence前不久发布的MiniCPM-Llama3-V2.5惊人地相似。

斯坦福团队抄袭清华大模型，作者深夜道歉，中国的大模型已经不能被忽视了

为此，X用户@yangzhizheng1也发布了相应的质疑证据。

证据一：Llama3-V和MiniCPM-Llama3-V 2.5的模型结构和代码几乎是复制粘贴级别的相似。

不同之处可能是他们换了马甲——变量名变了。

就像同一件衣服，但纽扣颜色不同。

你认为这是巧合吗？证据2：当Llama3-V的作者被问到为什么可以使用尚未提前发布的MinicPM-Llama3-V2.5分词器时，他们解释说他们使用的是wall的上一代MinicPM-V-2 - 面向智能。

项目。

不过，一些媒体寻求 Wallface Intelligence 官员的证实。

在HuggingFace中，MiniCPM-V2和MiniCPM-Llama3-V 2.5分词器分别是两个文件，文件大小完全不同。

此外，MiniCPM-Llama3-V 2.5的tokenizer是由Llama3 tokenizer加上MiniCPM-V系列型号的专用token组成的。

考虑到MiniCPM-V2的发布时间早于Llama3，理论上它不可能包含尚未公开的Llama3分词器技术。

证据三：更离谱的是，作为llama3-V项目负责人的作者，还面临着用户的质疑。

见情况不妙，干脆上演了一出“删库跑路”的好戏。

连GitHub上的项目页面都被删除了，堪称欺骗性的2.0版本。

抱脸的地址如下。

目前，当我们打开页面时，我们只能看到“”。

用户@yangzhizheng1表示，如果在MiniCPM-Llama3-V 2.5的检查点中添加高斯噪声（由单个标量参数化），则所得模型将与Llama3-V同模雕刻。

不仅如此，这个模型还可以识别《清华简》等博大精深的战国古代文字，而且错误一模一样。

用面墙智能官方的话来说：不仅一模一样，而且错误也一模一样。

要知道，这份古文字资料，是清华大学历时数月对收集的清华简进行扫描、手工注释得到的。

它从未被公开过。

那么斯坦福人工智能团队是如何凭空得到它的呢？可以说，Wallface Intelligence 6 月 2 日深夜的声明可以被视为完全抄袭斯坦福 AI 研究团队。

直到今天凌晨，斯坦福 Llama3-V 团队的两名成员 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就此次学术不端行为正式向 MiniCPM 团队道歉，并表示将下架所有 Llama3-V 模型。

名校尖子生也会抄袭吗？中国的大型开源模式正在迎头赶上。

这件事之所以在网络上掀起波澜，一个重要原因就是抄袭作者的背景实在是光荣。

公开资料显示，Siddharth Sharma 和 Aksh Garg 都是斯坦福大学计算机科学系的本科生，发表过多篇机器学习领域的论文。

其中，Siddharth Sharma曾在亚马逊实习过一段时间，目前主要从事AI和数据相关的工作。

Aksh Garg 的实习简历很丰富，涵盖了 SpaceX、斯坦福大学、加州理工学院等知名机构。

至于被作者两位称为“代码搬运工”的穆斯塔法·阿尔贾德里（Mustafa Aljadery），他来自南加州大学。

舆论发酵后，X账号已被设为私人状态。

眼尖的网友并不接受斯坦福Llama3-V团队的道歉声明。

比如，斯坦福AI实验室主任Christopher David Manning用户也站出来谴责这种抄袭行为，并对MiniCPM这个优秀的中国开源模型点赞。

不过，也有网友抱着“随心所欲”的态度，悠闲地鼓励他们：开放和诚实是科技行业非常重要的价值观，期待你的新作品。

谷歌DeepMind研究员Lucas Beyer表示，中国开源的大模型有MiniCPM这样的好模型，但国际社会还没有给予足够的重视……Wall-Facing Intelligence团队昨天也对此事做出了回应。

面墙智能CEO李大海表示：“技术创新并不容易，每一项工作都是团队日夜努力的结果，也是对全球算力有限的技术进步和创新发展的真诚贡献我们希望团队的好作品能够被更多的人关注和认可，但不是这样的。

”面壁智能首席科学家刘志远也在知乎发文称，这一事件从另一个角度证明了中国创新成果的国际影响力，强调了开源共享性、尊重原创精神的重要性。

不得不说，这部AI圈的抄袭剧，是对“创新不易，必须做到并珍惜，学术诚信人人有责”的教科书般的诠释。

事实上，从去年开始，中国的大型开源模型就如雨后春笋般地从受益者转变为贡献者，并且不吝惜提供更多优秀的开源。

从阿里巴巴、腾讯等巨头到面墙智能，智普AI、昆仑天工等AI初创企业也是开源社区的活跃成员，为中国大规模模型的发展做出了贡献。

我们也希望这股开放共享的春风吹得更加强劲。

正如面壁智能CEO李大海呼吁大家共同努力，构建开放、合作、信任的社区环境。

站长声明

标签：

上一篇：Netflix 的游戏很好玩，但还不够

下一篇：2024年华为平板该如何选择？一下子了解这8款机型的区别

树盾科技完成1亿元C轮融资

据投资界9月27日消息，北京树盾信息技术有限公司近日完成1亿元C轮融资，成为2019年疫情下商用加密行业企业成功融资的新范例。亮点：本轮融资由国有资产和产业背景基金共同投资。北京树盾信息技术有限公司董事长李元骅先生表示：树盾科技凭借在商用密码行业的市场地位和良好

06-18
据36氪了解，庭院机器人“汉阳科技雅博”获过亿元Pre-A轮融资，昊辰资本领投

投资圈（ID：pedaily）3月16日消息，据36氪报道，庭院机器人公司“汉阳科技雅博”近日获得过亿元Pre-A轮融资。本轮融资由昊辰资本独家领投，参投方包括新加坡泽洛斯基金、庚辛资本中国、天使投资人王龙、硅谷投资人金HP、天使投资人成晓华、盛虹股份（深交所：93）董事长方兴

06-18
剑桥资本收购韩国最大医美公司Hugel股权，持续拓展全球医疗健康版图

据市场消息，以剑桥资本为首的财团近日达成收购43.2%股权的协议Hugel Inc.（20.KQ）是韩国最大的医学美容公司。股权协议。这是韩国乃至整个亚太医疗行业迄今为止最大的收购之一。交易完成后，剑桥资本将成为Hugel的控股股东。剑桥资本是亚洲最大的专注于医疗健康领域投资

06-17
“深蓝航天”完成近2亿元A轮融资

近日，江苏深蓝航天股份有限公司（深蓝航天）宣布完成近2亿元A轮融资。本轮融资由由真资本领投，德通资本、奥瑞资本、银河创投、耀明资本共同投资。深蓝航天表示，本轮募集资金将继续用于星云一号液体火箭的研制、火箭可回收可重复使用技术的验证和发射准备工作，同时进一步

06-18
一季度，保险业实现总资产24.3万亿元，较年初增加9600亿元

一季度末，保险公司总资产24.3万亿元，比年初增加1亿元，比年初增长4.1%。

06-18
人工智能公司畅木谷医疗完成数千万元种子轮融资，锋锐资本与雷鸣共同投资

据投资界11月13日消息，人工智能高新技术企业北京长木谷医疗股份有限公司（简称“长木谷医疗”）宣布完成数十项投资本轮融资由锋锐资本和百度创始人七剑客雷鸣共同投资。针对本轮融资，畅木谷医疗联合创始人安奕成表示，畅木谷医疗致力于用最多的资金。前沿的人工智能技术

06-18
清科创投冯苏强：关注早期医疗项目并购整合是趋势

据投资界7月12日消息，在“第十三届中国股权投资中期论坛暨2019金融科技行业清科集团主办的“融合创新中期谈判”会上，清科创投董事、总经理冯苏强介绍，清科创投2016年开始投资美元基金，目前也开始投资人民币基金。对于医疗行业，清科创投目前的定位是关注一些早期项目。

06-18
【融资24小时】2022年6月14日投融资事件汇总及明细

今日国内市场共发生17起投资披露事件，其中先进制造5起（欧迪威、纳诺科技、合肥中恒威、青昀）明新材料、桃子自动化）、企业服务案例3个（卓筑汇、运通科技、睿科集团）、汽车交通案例2个（四山科技、速腾聚创）、本地生活案例2个（一汽美国、海纳云）、电商2个零售案例（生

06-17
AI Infra系统软件公司“清程极智”完成首轮数千万元融资，智谱AI投资

投资界（ID：pedaily）3月27日消息，AI Infra系统软件公司“清程极智”（北京清程极智）青城科技有限公司（Qing Cheng.ai）首轮融资数千万元。天眼查显示，清程极智近期完成了一轮工商变更，新增中金观博上海私募投资基金合伙企业（中金资本）、北京智普华章科技有限公司（智

06-17
悉尼一名孕妇在睡觉时被 iPhone 7 烫伤，当时手机正在充电

据澳大利亚新闻网等媒体报道，悉尼一名孕妇表示，iPhone 7在充电过程中烧伤了她的手臂。医生确认其为一级烧伤，她在脸书上发布了自己的遭遇。这名孕妇名叫Melanie谭Pelaez(Melanie Tan Pelaez)，她说她正在给手机充电，并在手机上看电影，然后才睡着。第二天一早，她醒来的

06-18
仁和资本募集两只新能源产业基金

据投资界（ID：pedaily）6月13日消息，仁和资本旗下两只新能源主题基金仁和嘉润、仁和氢能近日已顺利完成募资。主要投资氢能、钠离子电池、钙钛矿、储能等新能源赛道。氢能已成为加快能源转型升级、培育新经济增长点的重要战略选择。全球氢能产业链关键核心技术日趋成熟。

06-18
美版iPhone 12专属的5G毫米波和国版有什么区别？

今年的iPhone 12又恢复了往日涨价的辉煌。去年因为iPhone 11没有5G而持观望态度的用户终于有了转用的理由。发布会上，苹果还介绍了5G作为最重要的亮点。 iPhone 12支持目前几乎所有5G频段，超过主流安卓机型，但只有美版支持毫米波频段。有网友因此疑惑，不支持毫米波的国

06-21