首页 > 科技启迪 > 内容

设备端人工智能的新篇章!商汤科技发布“最快”客户端模型

发布于:2024-06-17 编辑:匿名 来源:网络

作者 |李媛编辑|郑玄设计行程、生成文案、进行总结、智能拓展地图。

客户端模型可以做到这一点吗?而且这么快? 4月23日,商汤发布日日信5.0大模型系统。

其中,研究端模型SenseChat-Lite成为本次发布的亮点。

不仅领先同级别所有开源2B机型,在评测中也位列第一。

部分超过 Llama-2 7B 型号的性能。

去年以来,大型端到端模型成为消费电子行业和人工智能行业的热门话题。

端侧大模型是运行在设备侧的大模型。

它通常比我们熟悉的GPT等大型模型参数更小,因此可以直接利用端侧算力运行。

设备端人工智能具有多种优势,例如能够在任何网络条件下生成答案、隐私不必离开设备、不需要云计算能力,因此成本较低。

更强的终端侧AI能力,意味着原本不可能的用户场景将被进一步打开:工作文档也可以直接使用手机上的大模型进行处理,不用担心泄密;人们在飞机上也可以在没有网络的情况下与外国人顺利聊天;您不想让孩子的手机连接网络,但您也可以让孩子在不连接网络的情况下学习知识、听故事。

因为成本较低,也会对消费电子行业本身产生影响。

端侧模式将让包括汽车、XR在内的各种终端设备,特别是智能音箱等平价电子设备,有机会获得智能体验。

无需考虑太多的算力成本。

低延迟还将为 AI Pin 等未来设备开辟场景,并提供可用的体验。

极客公园最新的客户端模型能力展示,让我们感受到了客户端AI的快速进步。

未来,端侧AI的市场将非常广阔。

最快的端侧大模型 最让我们惊讶的是端侧大模型的响应速度。

虽然在测试之前我们就已经知道商汤的大模型反应非常快,但测试结果仍然令人惊叹。

对于人眼来说,每秒阅读20个字已经是人眼的极限了。

这次,商汤的模型在中端平台上可以达到每秒18.3个字,在旗舰平台上可以达到每秒78.3个字!在测试中,生成速度确实非常快,确实给人一种肉眼跟不上的感觉。

除了生成速度之外,响应速度也比我们熟悉的云端AI更快。

小米小爱团队负责人王刚曾表示,在做小米小爱产品时,为了提供更好的用户体验,团队原本希望找到响应时间小于1.4秒的云模型接入,但发现1.4秒对于云模型来说是不够的。

这对于大型模型来说太严酷了。

事实上,连接云模型的响应时间约为2秒。

这次,商汤客户端模型的首次加载时间不到0.4秒,远远低于即使是更先进的云模型的响应速度。

响应速度和生成速度共同构成了我们对设备端模型的第一印象,就是快——确实是业界最快的设备端模型。

除了响应速度之外,我们还测试了模型的基本能力。

我们首先看一下模型的生成能力。

给出的提示词是:帮我写一篇《红楼梦》的读书笔记。

可以看到,虽然我们没有在提示词中设置字数要求,但SenseChat-Lite一点也不偷懒,直接生成了一篇字数相当长的读书笔记。

显然,模型本身很好地诠释了《红楼梦》故事的走向、意义和人物。

您是否害怕您的孩子拿起联网的手机没完没了地玩?未来,也许我们可以给孩子一部没有网络的手机,让大模特辅导孩子。

然后我们发了一条关于文案的微博。

令我们惊讶的是,在这个场景中,我们没有限制字数,但模型独立生成了一个较短的文案来匹配微博的字数限制。

他还知道怎么加上#毕业祝福#这个标签。

显然,使用中文语料库训练模型还是有用的。

该模型非常了解文案在每个场景中所需的长度和风格,并且可以直接模仿。

完全可以想象,基于同样的模型能力,还可以直接使用客户端模型生成淘宝评论、生成文案朋友圈、生成活动促销等。

商汤表示,在训练过程中,他了解到了很多用户在手机场景下喜欢问的问题,并针对他们进行了专门训练,看来效果确实不错。

最后,我们测试了文档摘要的功能。

段点模型很快将七段复杂的文本概括为两段关于文案的内容。

您收集了多少篇太长而难以阅读的文章? 这也很正常。

用手机看长文,确实是反人类的行为。

随着端端AI的出现,无论你是在飞机上还是火车上,当你无法阅读长篇文章时,或者当你懒得看工作文档而必须处理它时,端端模型都可以快速帮你总结要点。

除了端侧谈判模式之外,商汤还展示了端侧多模态扩散模式的能力。

多模态模型在手机上主要用于照片处理,可用于相册管理、图像生成等多种场景。

这次我们看到的是商汤的AI图像扩展模型的演示。

用手机拍照的时候,有时我们会因为角度或者为了避开游客而对图片进行裁剪。

AI图像放大在这种情况下可以利用AI计算图像的边界,生成无遮挡的图像,重新调整图像比例,生成更好看、更适合分享的图像。

演示视频是商汤的免费图像扩展功能。

事实上,商汤的AI地图扩张有很多选择。

正常情况下你可以按比例放大图像,如果照片拍歪了,你也可以直接将其调整回直线,剩下的交给AI处理。

和SenseChat-Lite一样,这次图像扩展最令人惊奇的仍然是它的速度。

据悉,该扩散模型还实现了业界最快的设备端推理速度,在高通旗舰平台上可实现不到1.5秒。

发布会上,商汤还展示了与其他竞争对手类似功能的速度对比,差异显着。

在加载朋友提供的扩展图像后,商汤的客户端模型已扩展为九张图像。

设备上的人工智能也可以非常智能。

对于端侧AI来说,一个难以逾越的问题是,端侧AI是否足够智能? 带着这个问题,我们审视了端侧AI的生成能力。

以文章开头的行程为例。

行程规划不仅需要知识和能力——对开罗有一定的了解,还需要一定的推理能力,才能设计出好的行程。

如果模型不够智能,很容易导致“听你的比说的好”的情况,或者只生成简单的一两段答案。

这次,端侧模型生成得很好。

商汤科技介绍,客户端模型之所以能如此智能,是因为它搭载了商汤最新的数据清洗技术和高质量的数据。

根据缩放定律,当使用高质量的数据来训练模型时,小尺寸模型的能力可以超过比它大的模型的智能能力。

同时,当未来设备端模式真正投入用户使用时,商汤提出的解决方案是设备与云的结合。

商汤表示,在知识、考试、问答等场景中,端侧处理可以占比70%以上。

在其他场景中,比例可能略有不同。

不过,基于对真实用户使用场景的分析,商汤认为,事实上,大多数时候,用户提出的问题都是知识类和问答类问题,而客户端模式可以解决相当比例的问题。

设备端人工智能的新篇章!商汤科技发布“最快”客户端模型

他们。

为什么我们需要端侧模型? 云模型已经做得很好了,参数多,能力强。

为什么我们仍然需要客户端模型? 对于普通用户来说,最明显的感知可能就是生成速度快,这也是商汤此次发布的模型的优势。

商汤做了一个非常有趣的小游戏,让GPT-4和商汤的端侧模型分别接管格斗游戏玩家,体现速度的意义。

游戏中,GPT-4可以更好地分析如何闪避拳头,而且端侧模型的响应速度极快。

GPT-4来不及分析如何躲避,就被击中。

最终的结果就是端侧模型一片混乱。

一拳打死老夫子。

在用户的使用中,响应速度快,可以不断降低用户使用AI模型的心理成本()。

一张图片展开需要一秒还是五秒,可能会完全影响该功能的使用体验。

此外,设备端模型将通过其生成能力和断线条件下更强的隐私保护,拓展新的AI使用场景。

无论是在飞机上工作,前往无人区寻找救命之策,网络条件不好时进行翻译,还是给孩子一个断网设备学习,把机密工作文件留给大模型处理,让AI接触更多人。

个人数据等,都是客户端模型未来能够提供的实用场景扩展。

对于行业来说,影响可能更大。

目前,作为用户,我们接触到的云模型通常是免费的。

但免费并不意味着没有成本。

此类费用通常由其他方为用户承担。

例如,小米曾提到,接入大机型后,小米小爱同学的活跃用户留存第二天就增加了10%。

事实上,互联网产品往往需要进行巨大的改变才能将次日留存率提高5%。

次日留存的增加将带来用户活跃度的增加,以及更多的发行机会和更强的商业化能力。

这对于小米来说是一个非常宝贵的商机。

作为一家拥有手机、汽车、音箱等多种智能硬件的公司,小米自然希望将自己的车型接入更多设备,但这涉及到云车型的成本。

小米提到,中高端手机和汽车目前对大机型的成本并不敏感,但对于扬声器这样的设备,硬件企业很难承担一个生命周期内使用大机型的成本。

而且随着大型模型能力的提高,用户可能会越来越多地使用大型模型,因此成本将成为一个更大的问题。

在客户端模型中,所使用的计算能力和电力由设备本身提供。

用户无需额外付费即可获得改善的体验,而厂商则可以节省云的成本,这是一个双赢的局面。

端侧模式是人工智能普惠的重要路径。

此外,端侧模型的数据传输和延迟对于智能硬件大模型的使用体验也非常重要。

之前备受关注的AI Pin有一个非常未来感的概念——用大模型随时随地辅助生活。

但国外评论普遍表示,经验被推翻了。

主要原因之一是AI Pin全部采用云模型。

当设备进入室内、停车场等不同地点时,响应速度过慢,会严重影响产品体验。

采用端侧模型可以避免此类问题。

目前,商汤的客户端模式还无法让用户在手机上直接体验。

智能硬件厂商需要配合商汤共同部署。

不过,商汤表示,他已经与包括小米小爱同学在内的多家领先厂商合作,相信很快,用户在终端上体验的智能场景很大一部分将由终端AI承载。

除了可以适配多种芯片的手机之外,商汤目前发布的设备端模型还可以在XR、车载等平台上使用,这将使这些设备从无到有的智能化体验。

未来,端侧智能的能力也将被解锁,进一步赋能智能设备。

商汤最新的设备端模型让我们看到设备端模型的底层模型能力正在加速、变强。

未来,设备端模式也将拥有广阔的市场。

商汤正在为手机提供上一个人工智能时代的底层功能。

在大模型时代,我们再次抓住了相关机遇,不仅推出了能力堪比GPT-4的大云模型,这次我们还推出了最快的设备端模型。

凭借过去在智能设备市场的良好合作经验,商汤在设备端未来广阔的市场中具有巨大潜力。

*头图来源:视觉中国 本文为极客公园原创文章。

设备端人工智能的新篇章!商汤科技发布“最快”客户端模型

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • Verge Genomics 获 3200 万美元 A 轮融资,利用 AI 驱动新药发现

    Verge Genomics 获 3200 万美元 A 轮融资,利用 AI 驱动新药发现

    据投资界 7 月 17 日消息,利用机器学习算法开发新疗法的药物研发公司 Verge Genomics今日宣布完成1万美元A轮融资。 本轮融资由德丰杰创投领投,药明康德创业投资基金、ALS投资基金、Agent Capital、OS Fund等创新生物科技投资基金也参与本轮融资。 此轮超额认购使 Verge Ge

    06-17

  • 北京首支传感器产业基金成立 规模10亿

    北京首支传感器产业基金成立 规模10亿

    据投资界(ID:pedaily)了解,北京北工投资发起设立北京首支高端仪器设备及传感器产业投资基金——北京北工淮威传感科技股权投资基金(有限合伙)近日在北京成立。 传感器产业基金总规模10亿元,将全面服务北京国际科技创新中心建设,增强首都高精度产业链供应链韧性,加快

    06-18

  • 半导体企业疫情期间“畅通”物流链:封测厂直发,转运至广州、深圳、香港仓库

    半导体企业疫情期间“畅通”物流链:封测厂直发,转运至广州、深圳、香港仓库

    第一财经 4月18日,半导体及零部件板块小幅上涨早期交易。 截至发稿,上海电气股价涨幅超10%,其中启鹏小幅上涨6.77%,卓盛小幅上涨7.50%,东微半导体、江峰电子、盛美上海等紧随其后。 上升。 Wind数据显示,截至早盘收盘,半导体ETF(80.SH)上涨2.91%。 消息面上,上海多

    06-06

  • 美妆行业SaaS软件服务商“美管加”完成5000万元A轮投资

    美妆行业SaaS软件服务商“美管加”完成5000万元A轮投资

    据投资界5月27日消息,据36氪报道,美妆行业SaaS软件服务商“美管加”宣布已获得京东金融与京东集团A轮投资的万元合资企业。 此次融资后,除了升级产品、扩大销售网点外,美管加还将做出一系列延伸服务链的尝试。   公开资料显示,美管加于2001年创立,将美发行业互联网化

    06-18

  • PCIM Asia 2018汇聚全球知名展商,新能源汽车技术专区首次亮相

    PCIM Asia 2018汇聚全球知名展商,新能源汽车技术专区首次亮相

    PCIM Asia国际研讨会聚焦电力电子技术系统发展与趋势 PCIM Asia - 上海国际功率元件与新能源管理展是中国领先的电力电子、智能运动、可再生能源和能源管理展览会和研讨会。 新展将于6月26日至28日在上海世博展览馆举办,继续由广州光亚法兰克福展览有限公司、上海浦东国际展览

    06-06

  • 滑雪服火爆背后:寒风雪里生意火爆

    滑雪服火爆背后:寒风雪里生意火爆

    冬天来了,哈尔滨滑雪的爆发式人气,再次将本来就很火爆的滑雪热度推向了高潮。 数据显示,2020年11月以来,全国滑雪场门票预订量较疫情前年增长%; 2019年热门滑雪目的地前三名分别是黑龙江、吉林、新疆。 其中,新疆也是滑雪普及度增长最快的省份。 增加了4倍以上。 近年来

    06-18

  • 耀明资本创立的德达医疗获超亿美元融资,太古股份领投,

    耀明资本创立的德达医疗获超亿美元融资,太古股份领投,

    投资界(ID:pedaily)9月17日消息,心血管特色外资创新医疗服务集团通用医疗今日宣布完成最新一轮融资,融资规模为超过1亿美元。 本轮融资由香港上市公司太古股份领投,现有股东斯道资本继续支持。 融资完成后,太古公司将成为德达医疗的第二大投资者。 德达医疗将利用募集资

    06-17

  • 小马大众获住友商事A+轮融资

    小马大众获住友商事A+轮融资

    据投资界4月30日消息,食品冷链物流服务商小马大众近日完成A+轮融资。 投资方为住友商事株式会社,融资金额尚未披露。 元赋资本是财务顾问本轮的独家投资对象。 住友商事株式会社是日本五大企业集团之一。 未来,双方将在食品流通、融资租赁、供应链金融等领域开展合作。 此前

    06-18

  • 万谦紧固件完成数千万元A+轮融资,投资方为梧桐树资本

    万谦紧固件完成数千万元A+轮融资,投资方为梧桐树资本

    投资界消息,工业紧固件产业平台万千紧固件(原“万千工场”)已完成多轮融资。 千万元A+轮融资,本轮融资由梧桐树资本投资。 万谦紧固件CEO马明表示:“本轮融资后,万谦将持续推进全链条数字化进程;同时升级供应链,持续优化行业成本和效率通过可控的渠道,构建上游生产工

    06-18

  • 「AI托客宝」获数百万天使轮融资

    「AI托客宝」获数百万天使轮融资

    据投资界消息,2月13日,据猎云网消息,武汉云若信息技术有限公司宣布完成数百万天使轮融资今年11月底。 其产品AI托克宝也于不久前正式面向B端客户推出,帮助中小企业获客、捕捉商机。 本轮融资的融资方为个人投资者。 云若信息创始人张剑锋表示,“目前我们可以帮助用户知道

    06-18

  • 温州设立20亿元华侨创业创新产业基金,促进侨胞、留学生创业创新

    温州设立20亿元华侨创业创新产业基金,促进侨胞、留学生创业创新

    投资界消息(ID:pedaily),8月3日,龙湾一期拟联合设立浙江省温州市区政府产业基金 子基金名单公布公告显示,龙湾区政府产业基金拟设立子基金——温州华侨创新绿色产业基金(以下简称“华侨创新基金”)。 该基金计划总规模20亿元,初始规模10亿元。 据介绍,“华侨创新基金

    06-17

  • 全国首创!南京建邺区开展“金鱼嘴每日路演”活动

    全国首创!南京建邺区开展“金鱼嘴每日路演”活动

    全年路演场地,1亿元专项资金支持,打造创业投资活动标杆品牌,为全国投资者寻找最喜爱的创业黑马。 沃土万里行。 4月22日,建邺区召开新闻发布会,正式启动“金鱼嘴每日路演”活动,着力打造全国首个资本要素对接平台,打造全国基金区块中最具吸引力、影响力、引领创新。 投

    06-17