首页 > 科技未来 > 内容

“文心、同义、混元”的2023:路还很长很长,还很远

发布于:2024-06-18 编辑:匿名 来源:网络

新年的钟声即将敲响,站在这个历史节点,回顾过去的一年、发展最进步、最变革、最创新的行业非人工智能莫属。

人工智能的快速进步就像海洋一样??,激起无数的可能性。

其中,今年国产大型车型的出现和快速发展成为最引人注目的焦点,给我们每个人的工作和生活带来了前所未有的新奇体验,掀起了人工智能发展的浪潮。

它们的出现标志着人工智能从单一任务处理转向多任务、复杂任务甚至多模态任务处理。

这些大型模型不仅可以理解和生成人类语言,还可以理解和生成图像、视频等各类数据。

他们甚至可以在多个任务之间进行迁移学习,表现出惊人的灵活性和适应性。

不过,能力的跨越并不意味着大车型的研发就会一帆风顺。

庞大的参数量和计算要求使得训练和部署这些大型模型成为最具挑战性的任务,而国产大型模型在计算能力被封锁和限制的情况下就更加尴尬。

同时,大模型的强大能力与生产生活中的实际落地还有很长的路要走。

如何快速、准确、低成本地将它们放置在应该放置的地方,也成为许多大型模型制造商正在思考的问题。

尽管如此,我们仍然不能否认大型模型带来的巨大潜力。

它们为我们打开了一个全新的世界,让我们有机会以前所未有的方式理解和利用数据。

那么,回顾过去的一年,在人工智能发展的三驾马车——算力、数据、算法方面,“国产派”遇到了哪些问题,取得了哪些突破,有哪些想法?在百款大战甚至千款大战的背景下,各厂商都推出了什么样的大车型呢?面对大模型能力上线和落地难的问题,企业该如何解决? 01 大车型三驾马车发展走在前端。

算力、数据、算法作为大模型的三大支柱,都是不可或缺的因素。

年中,他们在各自的道路上取得了长足的进步。

,也面临诸多发展困难。

其中,算力是实现大模型的基础,发展基调可以概括为“外部制裁、内部发展、夹缝中求生存”。

今年8月底,美国官员下令芯片制造商英伟达停止向中国出售部分高性能GPU,另一家AMD半导体也收到了相关禁令。

一年后的10月17日,美国商务部继续延长今年10月首次实施的全面出口管制,并继续收紧尖端人工智能芯片的出口管制。

新规定下,英伟达最新的H自然是没有希望销往中国了。

就连去年新规出台后专门为中国设计的“第一版”GPU A和H也不会进口。

同时,随着管控规则的更新,除了可直接使用的产品外,芯片制造工具的出口限制清单也有所扩大。

中国两家国产GPU厂商——摩尔线程和必仁科技被列入“实体清单”,大型模型开发所需的算力受到很大限制。

但也正是因为这一禁令,国产GPU芯片不再被NV、AMD“骑在头上”,有了快速发展的窗口期。

其中,华为Ascend、寒武纪加速芯片等国产GPU芯片也在此次禁令的推动下迎来春天。

在与华为相关人士的沟通中,对方表示,华为Ascend于2018年发布,并于今年10月发布了最新的B芯片,相比上一代,FP32的性能有所提升。

科大讯飞副总裁江涛也在Q3性能发布会上透露,华为的Ascend B能力基本达到了NVIDIA A的标杆。

但在谈到升腾B的应用时,对方也表示升腾还有很多领域急需改进的。

比如现在的互联网企业更加追求性价比和易用性,而华为目前的服务器产品仍然基于鲲鹏,导致业务出现问题。

迁移成本较高,因此目前还处于早期POC阶段,真正量的增长至少需要20年甚至更长的时间。

除了被视为“中国NV”的华为升腾之外,有“中国AMD”之称的寒武纪也在加大AI算力芯片的研发和推广力度。

据媒体报道,百度内部测试结果显示,寒武纪首款产品思源最高性能接近A90%,整体性能与A80%相差无几。

但由于寒武纪采用ASIC架构,导致通用性较差,目前仍无法投入大规模训练。

除了华为和寒武纪之外,国内其实还有很多厂商在大力推动AI芯片的研发,比如海光的DCU、天枢智信的天盖、燧原的云燧、必人的BR等,都拥有很大的优势。

竞争力强。

作为后来者,虽然在能力和适用性上与NVIDIA最新的加速卡相差甚远,但它也在通过不断的技术创新和市场拓展展现出自己的优势。

竞争力。

在国内厂商大力推动AI芯片进阶的同时,面对目前海量的需求以及短期内只会愈演愈烈的AI芯片禁令,国内几大公有云厂商也在用“集中算力换卡”的方式与云”。

”解决计算能力问题的方法。

“集中算力,以云代卡”,顾名思义,就是把很多AI芯片聚集在一个地方,然后通过云端把算力传输到需要的地方。

这可以提高算力基础设施的质量和效率。

实现资源的优化配置和共享,这就是中小企业很难获得加速卡的原因。

相反,几大公有云厂商竞相构建算力池。

IDC数据显示,上半年我国AI服务器已使用了50万颗自主研发的AI加速器芯片。

华为推出升腾AI云服务,提供独立的AI算力服务。

在东方数字计算、西方计算的背景下,各地建立了多个使用独立AI算力的AI计算中心,保证云端AI算力的稳定可靠供给。

总的来说,算力是最受追捧和拦截的领域。

2017年,国内大型模型厂商同样靠拼凑生存,但面对算力差距拉大,将变得更加困难。

显然已经成为中国人工智能追赶世界顶尖水平的绊脚石。

因此,未来算力层面的公司也会多次退出炒作,可以关注相关投资机会。

如果说算力决定了大模型能否发布,那么数据就是决定大模型好坏的关键因素。

大家都明白数据越多越好,数据多样性越好,数据质量越好,所以目标是一样的,方法也没有太大区别。

目前国内科技和互联网领先公司主要基于公共数据和自身独特的数据差异化来训练大模型。

例如,百度文心主要依赖于万亿级网页数据和搜索数据,阿里巴巴统易主要来自阿里巴巴大摩。

腾讯混元的训练数据大部分取自微信公众号、微信搜索等,但这些信息大部分都是互联的,所以截至目前,国内大模型的整体数据规模和质量相差并不远。

然而,有一个在最初几年的发展中没有被注意到的隐患,那就是高质量的语言数据和图像数据可能会被耗尽。

据机构预测,全球英语语言数据将在~年内耗尽,而能够训练出更好性能的高质量语言数据将在年内耗尽。

与英文数据相比,高质量的中文数据集更加稀缺。

虽然国内数据资源丰富,合成数据也很多,但由于挖掘不足,优质数据无法在市场上自由流动。

未来,厂商如果想在大模型上走得更远,或许需要投入资金寻找高质量的数据。

未来,知乎、豆瓣等掌握海量优质数据的公司,以及挖掘、合成数据的公司,也将获得一定的发展空间。

在算法层面,目前很多都是基于Google提出的Transformer模型构建的,并且还在不断更新和迭代,但这不一定是静态或必然的路径。

在AICC人工智能计算大会上,浪潮信息人工智能软件研发总监吴少华表示,想要接近甚至超越GPT4的能力,必须同时考虑算法和数据。

首先是算法。

不能盲目使用LIama结构或者Transformer结构而不做任何创新。

例如,在考虑算力不足时,在相同架构下可以尽可能减少参数数量,这样可以提高参数效率,节省算力,相当于从算法层面考虑算力成本,而这样更新和改进算法的想法是各大厂商一直在做的事情。

02 模式进步两轮驱动,基础与产业并重。

在底层技术不断迭代的同时,各大机型的不断发布自然成为最引人注目的事情。

自3月份百度发布文心模型以来,我们不断听到华为、阿里巴巴、腾讯等各大互联网公司,360、科大讯飞等AI公司,以及清华、复旦等高校的科研成果。

机构推出的大型车型及相关升级进展。

截至目前,已有10余种各类型大型机型上市并正在被用户使用。

来源:头豹研究 不过,这么多的大模型按照属性一般可以分为两类:基础大模型和行业大模型。

其中,基础大机型是指通用性强、适用范围广的大机型。

它可以用于多个领域和任务,也可以针对特定数据进行训练和调优,使其成为面向某个方向或专用于某个行业的大模型。

但基础大型模型的入门门槛较高,往往需要大量的计算资源和训练数据进行开发和优化。

以国内最强大的基础大模型——文心大模型为例。

其参数量飙升至万亿级,相关算力也由万卡AI集群提供,相关成本大幅增加。

同时,在具体实现上,很多人会发现,经过一年打磨升级的文信4.0、迭代后的同易前文、改进后的混元大模型,已经具备了和一些行业专用大模型一样的能力。

模型甚至是有一定的差距,所以他们认为基础大模型的能力可能没那么重要。

为每个行业训练大模型并快速应用到生产中是正确的做法,但这种想法是非常错误的。

与大型行业模型相比,基础大模型的参数量超过一定阈值后,AI效应将不再是随机概率事件。

这时候,将其训练成行业大模型,会更容易得到准确的结果。

同样,基础大模型也是其下所有产业模型的中心和核心。

只要“大脑”哪怕有一点进步,都会带动整个模型组能力的提升。

以百度为例,文信大模型4.0升级将提升所有行业模型在千帆智能平台上的实施能力。

此外,行业模型大多依赖人工标注和调优,存在成本高、周期长、效率低的缺点。

然而,基础大模型可以进行自学习、自监督、自修正,可以显着加速训练效果,还可以总结出不同情况下的通用能力,这样的训练可以使全知人工智能在电影是一个真正的可能性。

因此,在基础大模型还不可靠的情况下,放弃基础大模型的探索而转向行业大模型的开发,未免显得“短视”。

继续增加基础大模型的数量,或许有助于未来行业大模型的发展。

起到事半功倍的作用。

但作为一个门槛极高、成本巨大的赛道,还是留给大厂商吧。

而年中我们还可以欣喜地看到,BAT、华为等大机型梯队企业正在行业内布局大机型。

,在应用生态的过程中,基础大模型的迭代速度一直没有放松。

未来,随着基础大车型的突破,我国大车型的能力将有机会“一飞冲天”。

不过,基础大模型的建设固然重要,但并不影响行业大模型的发展。

相反,由于对大模型能力的巨大需求,年内金融、消费、能源行业的项目较多。

一个非常好的实施案例。

在金融行业,百度旗下杜小满采用“通用大模型+自有行业数据”的方式,打造了金融行业垂直大模型“轩辕”。

在金融应用场景中,传统的通用大型模型由于其训练数据很少接触金融行业的专业术语、业务逻辑和公式计算,因此在特定问题上表现不佳。

“轩辕70B”的优势在于其专业的金融能力,受益于预训练和微调阶段的海量金融专业语料库训练,无论是注册会计师考试(CPA)、银行/证券/??保险基金/期货资格、理财师、经济师等金融领域十大权威考试,都能提供专业的支持和解答。

图片来源:投宝研究院 但轩辕能的角色更像是一个助手,它提供的价值更多是在工具层面。

未来,随着金融行业大模型的数据合规、隐私安全等问题得到解决,将应用于更多交互场景,赋能金融行业数字化发展。

在一般消费领域,阿里巴巴、京东等依托电商的各大企业,都有客服机器人、营销数字人等大行业模式的应用。

在电商中,客服一直是最依赖劳动力的环节。

双十一、6月18日等购物节期间,需要24小时即时响应。

由于对劳动力的依赖,客服团队效率极低,很难让客户满意。

需要。

不过,今年双十一期间,京东、淘宝等平台都推出了智能客服。

以京东为例,“京小智”可以以人工价的零点几的价格为用户提供即时服务。

当连接到京东使用大模型后,就可以与消费者顺利沟通。

除了智能客服,京东的数字人在直播中也引人注目。

他们的形象可以根据企业的需求进行定制。

音色、形象、身高、体型等项目可根据企业需求进行个性化定制,并可与真实主播互动。

搭配轮班,甚至完全被直播主播取代。

此外,导购服务也是大模式融入电商行业后带来的新功能。

今年9月淘宝加入统一钱问后,淘宝问话可以为C端用户提供智能导购服务,消费者只要提出相关问题即可。

问题,AI可以快速提供你需要购买的产品、相关视频介绍、产品链接等,成为新的流量入口,让商家、平台和消费者实现三赢。

在较为“硬核”的能源行业生产场景中,华为、商汤科技等厂商都有深厚的造诣。

在能源电力行业,从业者曾经面临一个问题:能源短缺时如何将能源分配到最需要的地方,能源充足时如何储存。

这就涉及到虚拟电厂的调度问题,引入大规模能源建模后,可以对电力供需双方进行精准控制,起到“削峰填谷”的作用。

据投报研究院介绍,华为、商汤科技等厂商研发的电力行业人工智能大型模型已投入使用。

例如,华为基于L1级盘古电力模型推出了无人机电力巡检、电力缺陷识别等场景模型。

商汤科技以AI大模型为基础,提供电力系统大模型解决方案,持续向电力能源行业输出优质的AI算法和算力,赋能电力系统多领域智能升级。

此类行业大型模型和具体应用还有很多,而这只是其能力的第一年。

未来,更多的应用将会出现在我们身边,它们也将随着大模型能力的进化不断迭代,并走完从神化到祛魅的完整过程,真正成为人类最好的帮手。

03 结合云模型的新交付方式——MaaS 加速增长。

随着年中大车型的密集发布和快速增长,一个新的问题摆在了各大厂商的面前,那就是如何将大车型的能力整合起来,简单快速地交付到应该的地方。

是。

毕竟,如果产业化落地出现问题,那么大模型的一切都将成为空谈。

但此时,MaaS(模型即服务)的概念开始流行。

MaaS是指将大型模型封装成可调用的云服务,通过云计算平台提供给用户。

这种面向服务的模型部署方式将模型和计算资源放置在云端,用户可以通过简单的API接口调用模型。

,无需关注底层模型训练和部署细节,计算资源可根据需求自动扩展,实现弹性扩展和高可用。

像MaaS这样将AI与云结合并推出的形式,无论从需求、供给还是现有的云基础设施建设来看,都是必然的。

从需求端来看,企业仍处于向数字化智能化转型的阶段。

很多生产场景就像旱地,等待着人工智能的雨露帮助提升效率;在供给端,由于计算资源和存储资源的影响,不可能做到“人人有卡,人人都可以用”,所以只能采用集中算力然后投入的方式;在基础设施方面,在过去的十年里,我们已经构建了一套相关的完整的云系统,而MaaS正好可以替代SaaS。

因此,截至目前,几乎所有兼具云和大模式的厂商都发布了自己的MaaS平台——百度千帆、字节火山方舟、腾讯云MaaS平台、阿里云MaaS平台……都已上线。

以百度千帆为例。

内置一百多个提示模板,包含对话、编程、电商、医疗、游戏、翻译、演讲等十多个场景。

相关企业可以直接选择某个型号,也可以将现有型号添加到该型号中。

基本上就是根据自己的需求添加数据进行微调。

腾讯云MaaS的服务大体相同,提供金融、文旅、媒体、政务、教育等10大行业50余种规模化模型解决方案供客户调用。

除了百度和腾讯之外,其他MaaS平台也有类似的建设思路和方法。

他们都利用基础设施和行业理解来提供一整套开发工具和套件,以确保满足不同规模和需求的客户。

递送。

然而,2017年MaaS的发展还远未完成。

充其量只能说是为以后的发展树立了一个模板。

还有很多地方需要改进。

对于厂商来说最头疼的点之一就是基础大机型和行业大机型之间的差距。

俗话说“三百六十,第一为佳”,但在现实行业中,远不止这个数字。

让大厂家滚基本的大模型还可以,但是需要几万人甚至几万人来制作。

成千上万的开发者去接触每一个行业,为每一个方向定制特殊的大模型,无异于一厢情愿。

这需要真正的修行者参与,但难度也不小。

可以说,这个问题仍将长期困扰制造商、行业乃至社会。

另外,MaaS本身是一种云服务模式,算力是提供服务的基础。

“文心、同义、混元”的2023:路还很长很长,还很远

随着MaaS的发展,云服务市场对算力的需求呈现爆发式增长趋势,而厂商尚未理解其商业化逻辑和大模型数据的不断增加以及算力价格的不断上涨已成为一大问题。

限制MaaS发展的问题。

除了这两大痛点之外,用户教育也需要时间的积累。

闹吉体表示,腾讯云TI平台包含数据标注、训练、评估、测试、部署的全套工具,在没有技术专家、产品经理深入指导的情况下,就已经交给了行业客户和合作伙伴。

项目经理、运营等、程序员等都是按部就班的传授,很难满足定制化的需求。

但无论如何,MaaS等服务模式正处于发展初期,尚未形成较为成熟的模式。

未来,如果各大厂商有了清晰的商业模式,解决了算力短缺的问题,客户教育逐步完善,那就属于MaaS。

春天正式到来了。

04 写在去年,对于国产大车型的发展来说是充满机遇和挑战的一年。

在算力、数据、算法“AI三驾马车”的驱动下,国产大模型取得了长足进步,但也面临不少困难。

但令人欣喜的是,大模型作为新兴事物,很快就完成了商业模式的基本闭环。

虽然目前还存在不少困难,但能在最初几年达到这个水平,已经体现了国内互联网和科技巨头的实力。

工厂实力雄厚。

未来,随着底层技术、大模型能力、交付能力和商业化模式的进一步发展,人工智能将不断渗透到我们的生活中,成为每个人都可以借用的强大生产力工具。

【本文经投资界合作伙伴微信公众号授权:秋拍。

本平台仅提供信息存储服务。

】如有任何疑问,请联系投资界()。

“文心、同义、混元”的2023:路还很长很长,还很远

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 汽车垂直自媒体平台“车鸣兽”获维京传媒A+轮融资,估值1亿

    汽车垂直自媒体平台“车鸣兽”获维京传媒A+轮融资,估值1亿

    据投资界5月16日消息,汽车垂直自媒体平台“车鸣兽”获维京传媒A+轮融资,估值1亿< titlesplit > 《野兽》已完成A+轮融资。 京威京传媒投资,最新估值为1亿元。 据悉,新一轮资金将主要用于扩大媒体报道和开发小程序。 接下来,车命手将加速从新媒体向汽车导购服务的转型。

    06-17

  • 云天励飞陈宁:推动中国通用人工智能发展

    云天励飞陈宁:推动中国通用人工智能发展

    云天励飞、陈宁:推动我国通用人工智能发展 2020年9月24日至26日,在深圳市人民政府、全国社保基金理事会、深圳市财政局、深圳市地方金融监管局指导下福田区人民政府管理局在政府支持下,由深圳市引导基金投资有限公司主办、国信证券股份有限公司协办的“深圳产业投资者大会”

    06-18

  • 扬杰科技开展高频IGBT芯片研发

    扬杰科技开展高频IGBT芯片研发

    5月15日,扬杰科技回应称,公司已开展高频IGBT芯片研发,将陆续推出适合高频应用的产品。 频率开关应用(如焊机、感应加热和医疗器械电源用高速 IGBT 模块)。 5月10日,扬杰科技在年度业绩网上说明会上介绍,公司尚未建设8英寸芯片生产线,目前也不考虑规划12英寸芯片生产线

    06-06

  • 苏宁首家24小时店已上线,首批20家店即将开业

    苏宁首家24小时店已上线,首批20家店即将开业

    据2月14日消息,苏宁店Biu24h已在南京玄武诺富特酒店一楼正式开业。 规划中的20家无人店将在北京、上海、广州、南京等一二线城市落地。 与传统无人便利店不同的是,更换为电子自动门后,苏宁小店Biu24h白天安排店员正常营业,晚上10点至早上7点改为无人值班,变成了无人便利店

    06-17

  • 小度科技独立融资:投后估值200亿元,百度独家控股

    小度科技独立融资:投后估值200亿元,百度独家控股

    \ 据投资界9月30日消息,百度宣布完成旗下智能生活事业群(以下简称“小度”)技术”)签署独立融资协议。 融资完成后,百度仍对小度科技拥有绝对控制权。 小度科技融资后,投后估值达到约1亿元。 本轮融资由百度资本、CPE Strategy领投,IDG资本跟投。 作为公司重要的战略业

    06-18

  • 中国运动相机迎来“太空时代” NASA采用中国创新公司Foream的顶尖技术

    中国运动相机迎来“太空时代” NASA采用中国创新公司Foream的顶尖技术

    当地时间10月28日,美国国家航空航天局(NASA)的一枚无人火箭在6秒后点火升空发生爆炸。 绝大多数中国人并不知道,这次发射标志着中国运动相机技术“太空时代”的到来。 这枚火箭首次搭载了三台经过NASA严格测试、能够承受巨大加速度、失重、真空和宇宙射线考验的运动相机—

    06-18

  • 超星未来获数亿元Pre-B轮融资,加大对边缘端大模型推理芯片的投资

    超星未来获数亿元Pre-B轮融资,加大对边缘端大模型推理芯片的投资

    投资圈(ID:pedaily)据5月9日消息,边缘端人工智能智能芯片提供商北京超星未来科技股份有限公司(以下简称“超星未来”)已完成数亿元Pre-B轮融资。 投资者包括众安资本、梁溪科技、龙鼎投资、天智投资、陕汽智能汽车基金和科大讯飞创投。 本轮资金将用于研发新一代大模型推

    06-17

  • 英福康上海工厂真空计产线落成投产

    英福康上海工厂真空计产线落成投产

    INFICON上海工厂的真空计生产线于2019年11月2日竣工并投产。 INFICON,创新仪器仪表、关键传感器技术和先进过程控制软件的领先供应商,在其上海工厂,举行了全新真空计的落成典礼仪表生产线举行庆祝活动。 该生产线将实现英福康代表性真空计产品的完全自主生产和交付,为用户

    06-06

  • 我们花了两个月的时间采访“专科专家”,发现了这些问题

    我们花了两个月的时间采访“专科专家”,发现了这些问题

    专科专家的受欢迎程度从今年7月以来一直持续。 这一年即将结束。 今年,我们看到很多趋势消失,也有幸看到市场新力量不断涌现。 从今年7月底中共中央政治局会议要求加快专精特新中小企业发展解决“卡脖子”问题,到开放11月中旬在北京证券交易所挂牌上市,以服务专精特新企业

    06-17

  • 朱啸虎要把所有滴滴快车变成便利店!一个智能“小盒子”值多少钱?

    朱啸虎要把所有滴滴快车变成便利店!一个智能“小盒子”值多少钱?

    新芽君友情提醒:为期三个月无假期的年终冲刺开始了!亲爱的胖友们,最近有没有感觉头晕、晚上失眠、白天犯困?本周,随着节日综合症的痊愈,大佬也没有闲着,大事接连发生。 最引人注目的是“两马”炫富的方式。 10月11日,马云在云栖大会首日宣布,将投资1亿成立“达摩院”

    06-18

  • 2018年共享单车:滴滴接管小蓝单车、摩拜与ofo合并陷入僵局、巨头正在亲手杀死“代理人”

    2018年共享单车:滴滴接管小蓝单车、摩拜与ofo合并陷入僵局、巨头正在亲手杀死“代理人”

    NewSeed(月3日讯,昨天,滴滴滴滴在据传将收购 小蓝 Bikes。 该消息是36氪透露的,报道称滴滴已签署收购协议,滴滴还正在孵化共享单车业务,代号“海棠”。 随后,搜狐科技等媒体也核实了同样的消息。 这或许表明,滴滴与摩拜、ofo的合并进展并不顺利,必须做好准备。 如果滴

    06-17

  • 国货美妆“五巨头”位置重新排列

    国货美妆“五巨头”位置重新排列

    国货美妆老大的位置要被取代了吗? 截至11月21日,国内五大美妆品牌第三季度财报已更新。 他们分别是百年日化龙头上海家化、国内发展最快的美容龙头珀莱雅、“玻尿酸之王”华熙生物、功能性护肤品龙头贝泰尼、新晋一鲜电商。 消费美容股龙头。 。 从前三季度总营收来看,珀莱

    06-18