科技部火炬中心:推动企业复工复产 确保奖补政策准确及时落实
06-17
前段时间,斯坦福大学人工智能研究所(Stanford HAI)发布报告称,美国在大模型领域遥遥领先。
报告指出,2018年有61个知名人工智能模型来自美国机构,远超欧盟的21个和中国的15个。
OpenAI早期投资者维诺德·科斯拉(Vinod Khosla)去年也在X上发表文章称,美国的开源模式将被中国复制。
然而,一直被认为“赶超美国”的国产大模型如今却成为了抄袭的对象,而被抄袭的AI团队正是来自发布上述报告的斯坦福大学。
斯坦福AI团队主导的Llama3-V开源模型被发现涉嫌抄袭清华大学国内开源模型“小钢炮”MiniCPM-Llama3-V 2.5,瞬间在AI圈引起轩然大波。
实锤之下,斯坦福团队也不得不紧急道歉。
正如面壁智能CEO李大海戏称,这是“国际团队认可的方法”。
无论距离顶级大车型有多远,国产大车型已经到了不能再被忽视的地步。
我们简单回顾一下时间线:斯坦福AI团队发布了Llama3-V,被称为SOTA多模态大模型。
网友对这个模型提出了质疑。
国产壁挂式智能手机MiniCPM-Llama3-V2.5抄袭证据浮出水面。
Llama3-V 作者上演了一场“删除数据库然后逃跑”的戏。
面壁智能手机官方深夜发布抄袭声明。
Llama3-V作者正式道歉,网友们纷纷坚决反对抄袭,面对情报“小钢炮”的围墙,斯坦福AI团队上演“删库跑路”。
近日,斯坦福 AI 团队宣布只需要美元就能训练出超越 GPT-4V 的 SOTA 多模态大模型。
但很快,就有X用户@yangzhizheng1指出,该项目使用的模型结构和代码与Wallface Intelligence前不久发布的MiniCPM-Llama3-V2.5惊人地相似。

为此,X用户@yangzhizheng1也发布了相应的质疑证据。
证据一:Llama3-V和MiniCPM-Llama3-V 2.5的模型结构和代码几乎是复制粘贴级别的相似。
不同之处可能是他们换了马甲——变量名变了。
就像同一件衣服,但纽扣颜色不同。
你认为这是巧合吗?证据2:当Llama3-V的作者被问到为什么可以使用尚未提前发布的MinicPM-Llama3-V2.5分词器时,他们解释说他们使用的是wall的上一代MinicPM-V-2 - 面向智能。
项目。
不过,一些媒体寻求 Wallface Intelligence 官员的证实。
在HuggingFace中,MiniCPM-V2和MiniCPM-Llama3-V 2.5分词器分别是两个文件,文件大小完全不同。
此外,MiniCPM-Llama3-V 2.5的tokenizer是由Llama3 tokenizer加上MiniCPM-V系列型号的专用token组成的。
考虑到MiniCPM-V2的发布时间早于Llama3,理论上它不可能包含尚未公开的Llama3分词器技术。
证据三:更离谱的是,作为llama3-V项目负责人的作者,还面临着用户的质疑。
见情况不妙,干脆上演了一出“删库跑路”的好戏。
连GitHub上的项目页面都被删除了,堪称欺骗性的2.0版本。
抱脸的地址如下。
目前,当我们打开页面时,我们只能看到“”。
用户@yangzhizheng1表示,如果在MiniCPM-Llama3-V 2.5的检查点中添加高斯噪声(由单个标量参数化),则所得模型将与Llama3-V同模雕刻。
不仅如此,这个模型还可以识别《清华简》等博大精深的战国古代文字,而且错误一模一样。
用面墙智能官方的话来说:不仅一模一样,而且错误也一模一样。
要知道,这份古文字资料,是清华大学历时数月对收集的清华简进行扫描、手工注释得到的。
它从未被公开过。
那么斯坦福人工智能团队是如何凭空得到它的呢?可以说,Wallface Intelligence 6 月 2 日深夜的声明可以被视为完全抄袭斯坦福 AI 研究团队。
直到今天凌晨,斯坦福 Llama3-V 团队的两名成员 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就此次学术不端行为正式向 MiniCPM 团队道歉,并表示将下架所有 Llama3-V 模型。
名校尖子生也会抄袭吗?中国的大型开源模式正在迎头赶上。
这件事之所以在网络上掀起波澜,一个重要原因就是抄袭作者的背景实在是光荣。
公开资料显示,Siddharth Sharma 和 Aksh Garg 都是斯坦福大学计算机科学系的本科生,发表过多篇机器学习领域的论文。
其中,Siddharth Sharma曾在亚马逊实习过一段时间,目前主要从事AI和数据相关的工作。
Aksh Garg 的实习简历很丰富,涵盖了 SpaceX、斯坦福大学、加州理工学院等知名机构。
至于被作者两位称为“代码搬运工”的穆斯塔法·阿尔贾德里(Mustafa Aljadery),他来自南加州大学。
舆论发酵后,X账号已被设为私人状态。
眼尖的网友并不接受斯坦福Llama3-V团队的道歉声明。
比如,斯坦福AI实验室主任Christopher David Manning用户也站出来谴责这种抄袭行为,并对MiniCPM这个优秀的中国开源模型点赞。
不过,也有网友抱着“随心所欲”的态度,悠闲地鼓励他们:开放和诚实是科技行业非常重要的价值观,期待你的新作品。
谷歌DeepMind研究员Lucas Beyer表示,中国开源的大模型有MiniCPM这样的好模型,但国际社会还没有给予足够的重视……Wall-Facing Intelligence团队昨天也对此事做出了回应。
面墙智能CEO李大海表示:“技术创新并不容易,每一项工作都是团队日夜努力的结果,也是对全球算力有限的技术进步和创新发展的真诚贡献我们希望团队的好作品能够被更多的人关注和认可,但不是这样的。
”面壁智能首席科学家刘志远也在知乎发文称,这一事件从另一个角度证明了中国创新成果的国际影响力,强调了开源共享性、尊重原创精神的重要性。
不得不说,这部AI圈的抄袭剧,是对“创新不易,必须做到并珍惜,学术诚信人人有责”的教科书般的诠释。
事实上,从去年开始,中国的大型开源模型就如雨后春笋般地从受益者转变为贡献者,并且不吝惜提供更多优秀的开源。
从阿里巴巴、腾讯等巨头到面墙智能,智普AI、昆仑天工等AI初创企业也是开源社区的活跃成员,为中国大规模模型的发展做出了贡献。
我们也希望这股开放共享的春风吹得更加强劲。
正如面壁智能CEO李大海呼吁大家共同努力,构建开放、合作、信任的社区环境。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-21
06-18
06-21
06-06
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态