首页 > 科技启迪 > 内容

技术变革的原始驱动力，大模型层

发布于：2024-06-17 编辑：匿名来源：网络

预训练大模型的分类和引入。

基于两大类基础设施衍生出各类大型模型；多模态已成为趋势。

预训练的大型模型可以分为文本、图像、视频、代码、音乐生成等多种类型，但从底层架构来看都分为两类。

Transformer是一个编解码模型框架，适合处理文本、代码等强连续性生成任务； Diffusion、GAN、NeRF 等框架擅长处理图像生成任务。

叠加的文本图像转换技术可以形成文生图模型。

单模态模型在实际训练时可以与其他模态技术融合，形成多模态、跨模态大模型，如GPT-4、文心一言、Midjourney等。

由于多模态模型可以接受文本，不同的输入输出形式可以更广泛地适应应用场景，重点发展多模态模型已成为业界和研究界的共同趋势。

各种模态技术分支和面向功能的预训练大模型。

预训练大型模型的开发。

中美引领大模型行业发展，NLP仍是大模型重点活跃领域。

从全球范围来看，中国和美国在大型车型领域处于领先地位。

都取得了令人瞩目的成果。

2016年，美国率先在大模型领域取得突破，推出了BERT、GPT等具有里程碑意义的预训练模型。

2016年，ERNIE系列模型、小BERT等轻量化模型的推出，拉开了中国大型模型行业快速发展的序幕。

今年以来，中美两国在大模型领域逐渐呈现出较量之势，共同引领全球大模型行业的发展；着眼国内，从技术领域来看，国内大模型广泛涵盖自然语言处理、多模态、机器视觉等多个技术分支，形成了紧跟世界前沿的大模型技术群。

其中，自然语言处理是目前国内大模型最活跃的技术领域。

国内60%以上的大型模型主要是基于自然语言处理技术进行预训练和微调。

多模态领域的活跃度仅次于自然语言处理技术，国内60%以上的大型模型都是基于自然语言处理技术进行预训练和微调的。

国产大型模型20%可处理图像、视频、音频等多模态数据；而国内专注于计算机视觉、智能语音等领域的大型模型数量相对较少。

从研发主体来看，国内企业、大学、科研机构等不同创新主体都在积极参与大模型研发。

其中，企业仍是我国大型车型研发的主力军。

约46%的大型车型由企业自主研发。

大学和科研机构也为大型模型的研发做出了巨大贡献。

约37%的大型模型是由大学/科研机构开发的。

该机构进行自主研发。

同时我们也观察到，目前只有不到20%的大模型是由企业与大学/科研机构联合开发的，这说明大模型开发在产学研合作方面仍然有很大的潜力。

探讨人工智能时代预训练大模型理解“ios”和“Android”的路径。

闭源和开源市场将共存、互补。

在以OpenAI为代表的闭源模型厂商向外部开放技术服务之后，开源模型厂商也在加紧发力。

技术变革的原始驱动力，大模型层

我们努力不断开源迭代以Meta的Llama模型为代表，意图进一步实现生态包围。

上半年，LLM和数据集将迎来开源季。

大模型的开源按照开源程度可以分为“可研究”和“可商用”级别。

今年2月，Meta发布了Llama，这是开源大模型LLM的第一个版本，被授予“可研究”用途。

今年7月，“市售”的Llama2版本进一步发布。

虽然日活用户超过7亿的产品存在商业限制，需要额外应用，无法服务其他模型调优，但不少海外中小企业已经使用Llama2模型进行私有化。

基于Llama2开源模型部署和训练定制的可控模型。

由于Llama2基本不支持中文，所以暂时不会对中国的大模型商业生态产生实质性的改变。

中国仍需要发展和培育适合中国数据土壤的开源生态系统。

闭源LLM可以持续为B端用户和C端消费者提供优质的模型开发和应用服务；开源LLM可以从研究角度促进开发者和研究人员的探索和创新，从商业角度加速大型模型的商业化进程。

具有落地效果。

未来，开源和闭源LLM将共存、互补，为大模型的开发打造多元化协作的繁荣生态。

致力于打造中国AIGC开源社区生态。

轻量级模型将陆续开源，助力构建开源生态。

数千亿个模型将暂时以闭源方式开发。

在中关村论坛上，科技部副部长吴朝晖表示，中国将坚持开源协作，加强大模型技术。

持续创新，协同解决透明度、稳定性等共性问题，进一步推动计算资源和数字资源开放共享，加快形成规模化产业生态系统。

AIGC开源社区的建设可以吸引更多的开发者并拥有主动定义用户的能力，以AI开源创新平台为杠杆，带动支持底层AI芯片、智能计算中心和云服务的基础设施的发展。

从供给侧逻辑来看，大模型开源早期是由大学和机构推动的，比如清华大学的ChatGLM-6B、复旦大学的MOSS等。

领先的云厂商逐渐加入，如百度的文信系列、阿里巴巴的统易系列等。

，共同为中国AIGC开源社区建设贡献力量。

以阿里云魔塔社区、百度云飞桨社区为代表的开源社区建设成果开始显现，而千亿级模式暂时通过闭源路径发展。

凭借稳定、高品质、完整工具链等产品特点定位应用市场；从商业化路径来看，参照海外明星开源社区HuggingFace的商业模式，中国AI开源社区也将首先免费提供基础算力，并为客户提供免费的社区体验、演示部署和测试，以及通过付费服务进一步推动轻量级迁移微调推理服务或深度开发训练调优平台，提升模型产品性能，吸引开发者和企业客户通过开源社区完成更多部署应用资源的分流和变现。

大模型的落地将带来新一轮人工智能产业化扩散。

大模型的落地，将加快人工智能产业化进程，充分释放人工智能产业潜在市场空间。

大模型类似于一个“完整体”，能力全面、突出。

它不仅用途广泛。

，其能力相比小型机型有很大的提升。

因此，在使用大型模型进行应用开发时，可以采用“预训练+微调”的开发范式。

您只需针对特定任务对大模型进行二次开发和微调，甚至简单地利用领域知识库作为辅助，就可以快速赋能。

应用。

与独立、分散的小模型开发相比，其标准化程度和流程更高，大大提高了开发效率和运维成本，有效推动了人工智能的产业化生产。

同时，模型能力的提升让更多的人工智能服务得以落地，有效拓展了人工智能的应用范围，共同促进人工智能供需双方潜力的释放。

MaaS是一种新的业务业态，实现大模型能力的输出。

打造大型模型商店，为下游用户提供低门槛、低成本的模型使用和开发支持。

MaaS（Model-as-a-Service），模型即服务，是指以云计算为基础，向用户提供大型模型即服务的一种新的业务业态。

如今，MaaS模式已经成为各云巨头厂商发展的第一战略重点。

它将模型作为重要的生产要素，依托现有的IaaS设施和PaaS平台架构，为下游客户提供以大模型为核心的数据处理和数据处理。

特征工程、模型训练、模型调优、推理部署等服务。

未来，顺应大模型开源趋势，MaaS服务商将重点打造大模型商店平台，着力打造大模型生态圈，融入更多允许商用的开源模型，完善丰富平台基础模型类型和能力，丰富工具链产品和服务。

通过业务积累、数据回流、模型迭代，逐步形成壁垒，在提升云服务收入天花板的同时，进一步塑造厂商核心竞争力。

市场需要评估基本的通用大型号产品服务能力。

艾瑞咨询提出EPS-EPD评估体系，定位大模型产品的基础模型性能和商业能力。

大模型能力评估具有重要意义。

评估结果可以让供需双方了解各企业的大模型能力。

优缺点，以便做出更好的产品调优和应用选择。

随着大模型行业的发展和迭代，评价基准体系也在不断完善。

艾瑞认为，未来大模型的产品服务能力评估将作为工具包，封装在大模型平台中，为客户提供产品服务。

对此，艾瑞咨询提出了EPS-EPD评估体系，以其为核心构建了一系列评估集来评估市场上大规模模型的能力，定位大规模模型的基础模型性能和商业能力全方位建模产品，为行业各行各业提供样板。

评估并向有结果需求的客户提供信息参考。

基础模式的实施，因需求差异而扩大了产业路径差异化。

大模型需要以行业级、企业级大模型的形式支撑上层应用。

基本大模型的实施面临两大问题。

一是终端客户接受算力成本的能力，二是大模型。

尽管他们擅长解决一般领域问题，但在垂直行业任务中往往表现不佳。

因此，基础大模型将通过领域数据或专属知识库进行训练和调优，形成垂直领域的大行业模型或商业模型；另外，部分企业还存在深度定制、私有化部署的需求，需要在行业内进行部署。

在模型的基础上，进一步添加企业专有数据进行训练或微调，形成企业级大模型。

从商业化布局来看，如今的大模厂商基本可以分为三类参与者，即云巨头厂商、人工智能公司、学术研究机构和初创公司。

他们将自己定位为通用能力基地，同时打通上游业务。

转型路径。

其中，云巨头厂商将利用云服务和数据库资源更加注重MaaS能力输出。

AI企业或初创公司会利用商业积累或生态资源，锚定几个典型行业或商业场景，展开商业占领。

从开源和闭源的角度来看，原型厂商普遍采用前面提到的“轻量级开源、千亿闭源”的发展路径，而向上差异化的垂直领域厂商会基于开源模式或原型平台进行开发和部署。

对于细分领域模型产品，厂商的优势在于垂直数据和业务理解。

如果客户（例如金融行业）对模型的开源和私有化部署有明确的需求，那么开源路径将是此类需求的典型实现形式。

大模型产业的实现形式及差异化路径如何连接模型能力和应用需求是实现的关键。

数据准备、ROI测量和Prompt工程是连接模型层和应用层的实施三个要素。

在大车型推动的这波科技浪潮下如何互联。

模型能力和上层应用，实现商业变现，构建以人工智能应用为主导的生态系统，是AIGC各级厂商关注的话题。

艾瑞认为，数据准备、ROI衡量和Prompt工程能力是连接模型层和应用层的三个核心要素。

由于人工智能研究进展慢于国外、中文数据集论文发表难度大、NLP算法改进验证与数据集语言类型相关性较低等历史原因，导致国内外相关论文的数量和质量仍存在较大差距。

中文NLP数据集语料库。

从可行性、性价比和时间角度考虑，追赶期同步开发典型行业应用数据集是弥补中国NLP数据集短板的有效策略；从需求方的角度来看，大模型能力的应用需要结合业务场景和性价比进行选择。

对于大模型的应用方式和调用形式，如果基于安全和隐私需求需要私有化部署，投资成本会更高。

客户的ROI衡量是决定其能力商业化进程的关键；提示是触发AI模型生成内容的内容。

广泛的指示和提示项目可以进一步开发和优化提示。

从指令拆解到调用能力，大模型LLM多维度整合处理各种需求是影响未来交互效果和应用体验的关键。

工具层成为AIGC行业的新热点。

工具层的AIAgent和模型服务平台可以更好的匹配应用需求和模型能力。

艾瑞认为，大模型的中间层-工具层组成可以分为AI代理-代理角色和AI微调-大模型服务两类。

AIAgent是继大模型、AIGC之后流行的中间层产品。

它可以被视为一个智能体，能够感知环境和需求，做出决策并执行行动。

AutoGPT作为代表性产品，使用GPT-4编写自己的代码并执行Python自动化脚本，不断完成GPT的自我迭代和问题的改进。

目前，代理角色产品还处于第一代阶段。

未来将结合实际场景和垂直数据，作为调度中心，完成应用层需求指令的规划、存储和工具调用（引自Lilian Weng关于OpenAI的论文）。

大模型服务平台为企业提供模型训练、推理、评估、微调等全方位平台服务，并基于供给侧能力进行B端私有化部署（初创企业的入口）或平台资源调用而需求方的需求（云厂商的切入点）、模式和用户将呈现出明显的双边效应。

总体而言，中间层作为模型能力与应用需求的纽带，具有广阔的价值前景，或可作为构建工具生态的另一个核心入口。

但从另一个角度来看，中间层仍然嫁接在模型层之上，受到模型层能力的限制，“合格”的大模型能力基础将为中间层的发展和发展提供更加肥沃的土壤。

AIAgent更广泛的角色价值和发展空间已进入AI代理文明，极大地提高生产力。

沉淀垂直数据和业务理解是关键。

早在20世纪80年代，计算机科学家就开始探索和开发能够与人类交互的智能软件。

，类似于AIAgent的原型应用程序已经在构思和讨论中。

目前大型模型不断涌现的能力，成功地给了AIAgent更多的想象和实现空间。

一方面，大模型的语料资源包含了大量的人类行为数据，填补了AIAgent可行性和合理性的关键要素。

另一方面，大型模型的出现具有出色的上下文学习能力和复杂的推理能力。

在接受目标和设置后，他们可以自发地将其分解为简单而详细的子任务，而无需人工干预来完成其余部分。

工作，如Sweep完成整个项目的自动“清理”Bug报告和功能请求、CheatLayer自动化整个网页的操作、GPTResearcher完成任意主题的综合研究演示等。

浅层取代了传统的RPA和人工重复工作，并深层成为人类各行各业的运营助手。

目前，AIAgent已经成为继大模型之后的下一个突破点，更具有想象空间，也更贴近应用。

海外亚马逊、OpenAI以及国内高校、云巨头厂商都热情高涨，相继发布了AIAgent的学术研究成果和产品应用。

未来，人类与AI的协作沟通可能进一步通过Agent作为智能媒介来实现。

每个人都可以使用各种AI-Agent来完成现实生活中任务的处理和执行，人类将进入庞大而复杂的AI智能文明。

为了实现这一点，必须将有价值的垂直数据和业务理解融入到Agent框架中，以确保大型模型应用程序在执行任务时能够访问正确的信息并高效地执行输出，以便AIAgents在未来发挥实际作用。

钥匙。

与模型层相比，AIAgents将为创业者留下更多的机会。

#阿里云#创业者计划#中小企业服务#9月21日，创新创业年，阿里云正式启动阿里云创业者计划，联合知名投资机构、加速器、服务创造机构以及大企业的创新力量，旨在为初创企业提供全方位的赋能和服务，帮助初创企业在阿里云上快速建立自己的业务，开启智能时代的创业新范式。

站长声明

标签：

上一篇：科创板上市委员会：联影医疗、普亭风光将于4月15日召开首次会议

下一篇：神话背后，增长黑客之父肖恩·埃利斯揭秘成长的三个阶段

劳力士在二手市场“跳水”

以劳力士、百达翡丽为代表的高端品牌在二手市场日益“失宠”，引发二手表商和杠杆炒家叫苦不迭。来自上海的制表师商奢和小主制表师创始人沈正奇向时代财经透露，“我们年底回收的一只爱彼橡树系列5的价格高达1万元。今年7月，以1万元的价格出售。他直接损失了1万元。 “这

06-17
共享床位关闭现场调查：不合规床位依然存在，专业VC上门检查

才流行不到两周的共享床位因存在“安全隐患”这两天就“封城”了。新闻话题。据报道，北京、上海、成都等城市出现了长约2米、宽约1米、形似太空舱的“共享床”，并因火灾隐患相继被关闭。　　真相是什么？　　猎云网进行了现场调查，并致电拥有“共享床”的公司北京睡眠科

06-18
中芯国际与ASML签订12亿美元订单

相关消息：中芯国际成熟工艺设备供货许可证获批。中芯国际宣布，公司已完成2020年3月16日至2020年3月的批量采购协议，2日12个月期间与ASML集团签署采购订单，用于采购ASML产品，订单总金额1 美元,,,.中芯国际目前提供0.35微米至14纳米不同技术节点的晶圆代工和技术服务。其

06-06
对外投资合作指南（澳大利亚）——中资企业在澳大利亚开展投资合作应注意的问题及对策

8.中资企业在澳大利亚开展投资合作应注意的问题及对策 8.1 对澳大利亚投资合作的主要风险合作面临以下风险：（一）疫情目前，澳大利亚新冠肺炎（COVID-19）疫情依然严峻。截至今年7月，澳大利亚仍未完成接近覆盖全体人口的疫苗接种。澳大利亚于 2018 年 12 月 1 日开放边

06-18
又一位车企老板濒临破产：匆匆交棒95后孙女

又一位汽车公司老板濒临破产：1995年出生的孙女匆忙交出大权。在重庆首富造车的梦想破灭了。 8月27日晚间，力帆股份发布半年报。上半年，力帆不仅亏损26亿元，净资产降幅也扩大至96.12%，只剩下1亿元。第二天开盘，力帆的股价就跌停。这家成立20多年的老牌国产车企濒临破

06-18
据河北新闻网报道，石家庄市将设立两大产业发展基金，总规模达200亿元

投资界（ID：pedaily）9月13日消息，为深入贯彻落实石家庄市第十一次党代会精神石家庄市按照市两会精神，充分发挥政府产业基金促投资、扩投资、稳增长的关键作用，推动新一代电子信息两大产业发展生物医药率先取得突破。石家庄市将设立石家庄市主导产业发展基金（以下简称“

06-18
投资界新闻 - SI集团与上海医药集团联合设立500亿生物医药产业基金

投资界消息（ID：pedaily），上海医药与上海医药集团将联合设立上海生物医药产业基金，规模达1亿第一期1亿多元，最终规模1亿左右。　　据财联社报道，上海医药董事长周军表示，产业基金不是简单的投资基金，而是一个平台。 “两家公司未来将打造几个大平台，推动上海医药生物

06-17
1800亿巨头低价卖，只卖36亿

为什么低价卖？出奇。一家市值1亿美元的公司最近被以5亿美元的低价出售。其股东包括但不限于阿里巴巴、京东、腾讯。它就是Farfetch，一家成立于2008年的英国奢侈品电商平台，2009年在纽约证券交易所上市。这次的买家是韩国公司Coupang。官网显示，其成立于2007年，总部

06-17
同性恋社交应用Zank是如何冲出红海并获得B轮融资的？

就在昨天，同性恋社交软件Zank宣布获得上市公司昆仑万维的数千万元B轮融资。赞克创始人和首席执行官凌绝顶表示，融资资金将用于完善同志电子商务平台的建设和直播产品的开发。资本看好“粉色经济” 互联网进入移动时代以来，社交软件层出不穷，充斥着人们的手机。在以微信

06-18
OpenAI与微软成立1亿美元AI创业基金

》5月27日，OpenAI正式宣布成立OpenAI创投基金，将通过该基金向AI公司投资1亿美元。 OpenAI正在寻找少量早期初创公司，这些公司所在的领域人工智能可以产生变革性影响，例如医疗保健、气候变化和教育，以及基于生产力的人工智能工具。

06-17
B轮融资3180万美元， 2年内已获得4轮融资，营收超15亿元，这家售油公司已经实现全面盈利！

据投资界8月24日消息，找游网宣布公司已完成1万美元B轮融资，由DCM领投，Wagonbang跟投，SIG耀明亚洲、云九等A轮投资方本轮融资，云启资本、GGV纪源资本、Venture Partners均继续跟投。冲盈资本担任本轮融资独家募资方。　　找油网创始人与CEO吕健表示：“未来，找油网将在

06-18
存储芯片需求放缓，三星电子高管表示没有减产计划

TechWeb 据报道，目前存储芯片市场形势并不乐观。由于对全球经济衰退的担忧而导致的需求放缓已经影响了终端产品的开发。需求反过来又影响存储芯片的需求。有研究机构预测，NAND闪存和DRAM的价格正在下降，明年市场供过于求的情况将加剧。存储芯片需求放缓和价格下降将不

06-06