中关村集成电路设计园正式开园
06-06
从小事成就大事的励志故事不仅发生在创业史上,也发生在发生在大型端侧模型中。
今年2月,面壁智能正式发布2B旗舰端侧大规模模型壁面MiniCPM,不仅超越了“欧版OpenAI”的性能基准,还全面领先于谷歌Gemma 2B级别,甚至在体积上超过了7B和13B。
近期,面墙智能还完成了数亿元新一轮融资,由春华创投、华为哈勃领投,北京人工智能产业投资基金跟投和别的。
知乎作为战略股东持续投入和支持,致力于加速推进大模型的高效训练和快速应用落地。
如今,端侧大模面壁MiniCPM小钢炮乘胜追击,迎来第二个四枪系列赛。
主题是“小而强,小而全”。
其中,MiniCPM-V2.0多模态模型显着增强了OCR能力,刷新了开源模型最佳OCR性能。
一般场景文字媲美Gemini-Pro,超越全系列13B机型。
在评估大型模型错觉的 Object HalBench 列表中,MiniCPM-V2.0 的表现几乎与 GPT-4V 相同。
在综合11个主流评测基准的OpenCompass榜单中,MiniCPM-V2.0多模态模型通用能力以55.0分超越Qwen-VL-Chat-10B、CogVLM-Chat-17B、Yi-VL-34B等更大的模型。
在官方演示案例中,当被要求详细描述同一张图片的场景时,GPT-4V回答了6次幻觉,而MiniCPM-V2.0只有3次幻觉。
此外,MiniCPM-V2.0还与清华大学展开深度合作,共同发掘清华大学博物馆的镇馆之宝——清华简。
得益于强大的多模态识别和推理能力,MiniCPM-V2.0无论是简单词“客”的识别,还是复杂词“我”的识别都能轻松应对。
在与国内同类基准多模态大模型的竞争中,MiniCPM-V2.0的识别精度遥遥领先。
精确细节的识别对图像的清晰度提出了更高的要求,而传统的大型模型通常只能处理小像素图像。
一旦信息被压缩,模型就变得难以读取。
但这对于MiniCPM-V2.0来说不是问题。
在官方演示案例中,面对普通的城市街景图片,MiniCPM-V2.0即使在肉眼不察觉的情况下,也能一目了然地捕捉到关键信息。
“全家”也能轻松攻克。
长图像包含丰富的文本信息,多模态模型往往无法识别长图像,但MiniCPM-V 2.0可以牢牢抓住长图像的关键信息。
从10,000像素到10,000高清大图像,甚至1:9(*)的终极长宽比,MiniCPM-V 2.0都可以实现无损识别。
据了解,MiniCPM-V 2.0高清图像的高效编码背后实际上采用了独家技术LLaVA-UHD。
模块化视觉编码:将原始分辨率图像划分为可变大小的切片,实现对原始分辨率的完全适应,无需像素填充或图像失真。
视觉压缩模块:使用共享感知器重采样层来压缩图像切片的视觉标记。
无论分辨率如何,代币数量都是可以承受的,并且计算成本较低。
空间修改方法:使用简单的自然语言符号模式来有效地告知图像切片的相对位置。
。
在中文OCR能力方面,MiniCPM-V 2.0也大幅超越GPT-4V。
相比GPT-4V的“无奈”,其准确识别图像的能力就更可贵了。
这一能力的背后是跨模态、跨语言泛化技术的支持,可以解决中文领域缺乏高质量、大规模多模态数据的挑战。
处理长文本的能力一直是衡量模型的重要标准。
虽然K长文本能力并不是什么新鲜事,但对于只有2B的MiniCPM-2B-K来说,绝对是值得称赞的事情。
最小的K长文本模型MiniCPM-2B-K长文本模型,将原来的4K上下文窗口扩展到K,在InfiniteBench榜单上超越了Yarn-Mistral-7B-K等多个7B模型。
通过引入MoE架构,新发布的MiniCPM-MoE-8x2B MoE性能平均提升4.5%,超越全系列7B模型以及LlaMAB等更大模型,而推理成本仅为Gemma的69.7%—— 7B. MiniCPM-1.2B证明“小”和“强大”并不相互排斥。
虽然直接参数减少了一半,但MiniCPM-1.2B仍然保持了上一代2.4B型号87%的综合性能。
在多个公开权威测试榜单上,1.2B机型能力非常强,综合性能超过Qwen 1.8B和Qwen 1.8B。
Llama 2-7B 甚至 Llama 2-13B 效果极佳。

MiniCPM-1.2B模型在iPhone 15手机上的录屏演示,推理速度提升38%。
已达到每秒25 token/s,比人类说话速度快15~25倍。
同时内存减少51.9%,成本降低60%,实现模型更小,但使用场景却大大增加。
在追求大参数模型的过程中,面墙智能选择了一条独特的技术路径——尽可能开发尺寸更小、性能更强的模型。
MiniCPM小钢炮的出色表现,充分证明“小”与“强”、“小”与“全”不是互斥的属性,而是可以和谐共存。
我们也期待未来有更多这样的车型出现。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-06
06-17
06-17
06-17
06-06
06-18
06-17
06-06
06-17
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态