首页 > 技术迭代 > 内容

腾讯的大模型故事从行业开始

发布于：2024-06-28 编辑：匿名来源：网络

ChatGPT火了之后，未来生成式AI的很多愿景直观地指向了微信。

这个每天有超过12亿人多次打开的地方，是当下最活跃的信息交流场，也是最有望被生成式AI重做的地方。

从不断出现和被屏蔽的各种野生“微信机器人”就可以看出这一点。

敲鼓的人多了，足见腾讯的谨慎。

“对于工业革命来说，提前一个月取出灯泡从长远来看并不是那么重要，”马化腾在今年5月的第一季度财务报告中表示。

他还表示，“关键是要把底层算法、算力和数据做好——更重要的是场景的落地。

”言外之意就是，腾讯要拿出来的东西，一定是产品和技术上都很完整的东西，并且已经想好了如何去实现。

6月19日，也就是马化腾讲话一个月后，腾讯首次披露了其在大型模型方面的进展。

主角就是腾讯云，专注于行业大模型。

“精选店” 如果说大模型的竞争是一场在所有人工智能领域对玩家进行技术水平的竞争，那么随着这几个月国内对大模型的讨论逐渐从一般性转向更务实的产业角度，相反，大制造商已经在更具体的竞争中找到了自己的优势。

“现在是一个合适的时机，跟大家分享我们过去一段时间积累的实践、沉淀、思考以及工具链（大模型）”，腾讯云副总裁、腾讯优图实验室总经理吴云生表示。

腾讯云向大模型方向迈出的第一步是腾讯云MaaS，或者说一站式行业大模型选品店。

腾讯云MaaS全景图来源：腾讯云云厂商被认为在大规模模式向垂直领域渗透的过程中发挥着巨大的作用，因为他们在服务企业客户的过程中天然具有垂直领域的视角，同时站在行业内场地。

超越每个企业狭隘的个人视角。

企业在大模型训练和部署的门槛和成本考量上遇到的障碍，将会从云厂商更高维度的行业角度来平衡。

首先是数据质量差的问题。

构建大型模型也是一项成本极其高昂的系统工程。

大型模型需要大量高质量的数据进行训练和优化。

还必须对它们进行清理和预处理，以消除噪声、填充缺失值并确保数据质量。

往往由于各种类型的数据出现问题，导致模型的效果和效率得不到保证。

如果导入的数据质量低，训练出来的模型也会出现问题——所谓的垃圾进垃圾出。

此外，计算资源是有限的。

大型模型需要相对较高的计算和存储资源，但许多公司和机构缺乏这些资源，导致无法训练和推断大型模型。

与普通服务器相比，GPU服务器的稳定性相对较低。

大型模型训练所需的GPU很容易达到1000卡路里。

而且，在训练集群中，连接数百台GPU服务器所需的网络速度非常高。

如果网络有点拥堵，训练的速度就会很慢，效率会受到很大的影响。

此外，大模型开发和实施方面专业知识和人才的缺乏，将进一步增加企业大模型的投资成本。

腾讯云开发MaaS并不奇怪。

后者被称为未来云厂商的基础能力，已经开始成为共识。

不同的是，腾讯云尝试用更多“量身定制”的解决方案来拆解企业在实施大型模型时面临的实际问题。

这个“精选店”拆开来看是一个三层架构：顶层是面向行业的MaaS层，底层是行业大模型和基础设施组成的技术基础，以及以腾讯TI平台为基础的工具层。

主体成为中级支撑，为企业客户提供涵盖模型预训练、模型微调、智能应用开发的一站式行业大模型解决方案。

发布会上，来自不同行业的17位生态合作伙伴同台亮相。

腾讯云在大规模行业模式上的优势首先来自于在工业互联网上多年积累的行业知识。

一般的大语言模型在处理工业场景时有一定的局限性。

首先，一般大型模型的训练数据主要来自公共数据集或网络数据，特定行业专业领域的知识有限。

而且通用大型语言模型的训练需要大量的计算资源和较长的训练周期，对于企业来说成本较高。

腾讯云MaaS的培训基于一套包括金融、政务、文旅等在内的优质行业大模型，目前已有智能客服、OCR、跨模态等50多个行业大模型应用检索等领域。

行业解决方案。

对于这些领域的公司来说，这意味着可以随时获得具有行业知识的大型模型。

在此基础上，添加自己独特的场景数据进行精细化训练，门槛就低很多。

企业可以快速生成自己的专属模型，也可以根据自身业务场景需求定制不同参数、规格的模型服务。

在具体的培训课程中，公司并不想回答一个完全开放的问题。

他们需要完整的模型工具和经过反复验证的高效成熟的训练流程来指导。

腾讯内部TI平台提供的工程能力，负责全栈AI开发服务，是腾讯云MaaS的核心。

后者拥有一整套从数据标注、训练、评估到测试和部署的大模型工具链。

TI平台是其背后的核心。

腾讯云在TI平台下推出了三大AI底层平台：TI DataTruth、TI ONE和TI Matrix，提供包括算法开发、模型训练、数据标注和数据处理在内的一系列开发能力。

此次平台升级计划强化了TI平台的工具属性，也成为腾讯云在大模型领域找到自己定位的伏笔。

TI-DataTruth专注于数据生产要素——提供数据标注运营、数据众包管理、场景数据挖掘等智能数据生产服务。

TI-ONE是整个大模型开发流程的重点——内置多种训练方法和算法框架，为用户提供从数据接入、模型训练、模型管理到模型服务的全流程开发支持，满足不同AI应用场景的需求。

需要。

TI-Matrix贴近应用层——支持各种数据、算法和智能设备的快速接入，并提供可视化编排工具用于模型服务和资源的管理和调度。

通过AI服务集成和标准化接口开放，进一步降低AI成本。

应用程序开发成本。

腾讯自研的机器学习框架“太极天使”也在传统CV和NLP算法模型的基础上增加了大型模型的训练和推理加速能力。

通过异步调度优化、显存优化、计算优化等方法，“太极天使”支持的训练和推理过程的性能较业界常用方案提升了30%以上。

“现在TI平台升级为MaaS，并不意味着工具属性没有了，工具属性还在，仍然非常重要。

但是除了工具属性之外，我们还构建了很多大型的行业模型，在平台中对他们进行训练，创建自己的模型后，该模型可以直接完成下游任务并为应用程序提供外部服务。

”吴云胜表示，此次TI平台完成了从算法到产品层面的全面升级，其背后是雄厚的算力。

由专为大型模型训练设计的新一代HCC（High-PerformanceCom马化腾gCluster）高性能计算集群提供。

今年4月，腾讯云发布了新一代HCC高性能计算集群，用于大型模型训练。

后者采用最新一代腾讯云星海自研服务器，多层加速的高性能存储系统，加上高带宽和低延迟。

网络传输，拥有业界最高互联网带宽3.2Tbps，算力性能提升3倍。

去年10月，腾讯完成了首个万亿参数大规模AI模型的训练。

在相同的数据集下，上一代HCC高性能计算集群可以将训练时间从50天缩短到11天。

如果基于新一代集群，训练时间将进一步缩短至4天。

在大产业模式的讨论中，一切都是为了产业的最终落地服务的。

这不是一个拥有数万亿个模型的规模游戏。

重点是灵活性和效率。

腾讯云还推出了更适合AI计算的矢量数据库。

腾讯的大模型故事从行业开始

后者可以更有效地处理非结构化数据源，例如图像、音频和文本。

其能力源自腾讯内部向量引擎（OLAMA），每天处理数千亿次检索，提供高吞吐量、低延迟、低成本和高可用性。

，弹性扩展的一站式矢量检索数据库。

单个索引支持10亿向量规模。

AI的检索和数据访问效率将比传统解决方案提高10倍。

大机型的崛起反过来正在重塑云厂商未来的发展方向。

腾讯云副总裁刘颖将其归类为AI1.0到AI2.0的转变。

“AI1.0时代，我们非常重视单机单卡的性能，标量数据的结构化精准检索，以及云原生带来的自动调度。

新背景下，AI2.0业务迭代速度更快，服务的重点也发生了变化，要成为AI企业和大模型，我们需要将重点转向集群性能、矢量数据存储和检索、自动容错等方面的提升。

”需要一个更加灵活、自由、高性能的云平台。

”“这也是腾讯云进军大模式的态度。

站长声明

标签：

上一篇：让自动驾驶汽车“透视”角落

下一篇：余承东想要的“免提驾驶”在北美已经使用了好几年了

瑞彼获数千万元追加A轮融资，奇富资本独家投资

投资圈（微信ID：pedaily）11月5日消息，据36氪报道，专注于人工智能应用开发的杭州特浪射频科技普加医疗科技有限公司（以下简称：瑞彼 plus/Rebeccatech）已于今年年初完成数千万元A轮融资，由启富资本独家投资；此前，其曾获得华盖资本和凯旋创投的投资。 Pre-A轮融资；此外

06-18
核心团队来自中南大学，宜化新能源获数千万元天使轮融资

据投资界（ID：pedaily）3月6日消息，固态电池企业湖南宜化新能源股份有限公司（以下简称“宜化新能源”）获得数千万元天使轮融资。本轮由东方富海、凌立韦创投投资。募集资金主要用于实验室建设和产品研发。宜化新能源成立于2001年，核心团队来自中南大学，拥有丰富的材

06-17
云之家田荣举：2016年企业协同怎么打市场？

田荣举云之家：2016年企业协作将如何冲击市场？ 2019年1月9日，金蝶企业移动工作平台云之家宣布永久免费。随后两年左右的时间里，企业移动协作领域开始快速激烈地发酵。初创公司分香素客在两年前分别获得了5000万和1亿的C轮和D轮融资。随后，芬香与阿里巴巴旗下钉钉大力投

06-18
vivo X7 Plus是一款续航3000元的热销产品，很放肆

随着用户对手机的依赖性越来越强，手机的续航问题一直是用户心中的痛。手机厂商在解决用户对于续航的需求上也下了很多功夫。增加电池容量已成为相当直接的解决方案。尤其是元系列的车型。由于元系机型基本都是大屏手机，因此这些手机的电池容量也相对较高。今天我就给大

06-18
无人挖矿服务商慧拓获得凯辉资本领投的超亿元A2轮融资，

据投资界3月5日消息，慧拓宣布完成过亿元A2轮融资，由凯辉汽车基金领投。投资方面，山东海创前锋新旧动能转换基金中的基金、老股东方资本和汉能创投也参与投资，汉能担任独家财务顾问基金，融资主要用于新旧动能转换的产品化、平台化和系统化。无人矿山整体解决方案，推动

06-17
阿里云【AI24小时】2024年1月10日

1.成立半年，获得过亿元天使轮融资。星动耀明专注于具身智能人形机器人研发 >> 点击查看星动耀明2020年8月公告成立于北京，由清华大学跨学科信息研究院孵化，致力于具身智能和仿人机器人的研发人形通用机器人技术和产品。此前，兴动纪元完成了由世纪财源领投、图灵创投跟投

06-18
GGV：齐飞的颜值和气质都是年轻人想要的

年轻人现在喜欢什么？他们每天做什么？如果您对这些问题感到困惑，下面的报告可以帮助您。投资机构GGV纪源资本近日发布了一份关于年轻人生活方式的报告。报道称，年轻人现在愿意花更多的钱来追求品质生活。可穿戴智能硬件不仅仅是一个标签，更是一个虚拟的自我。陌生人的

06-18
五牛基金全域：逃离股市，全球资产配置正在成为高净值人群的标准配置

据说，在史上最大规模的股市崩盘之前，已经有一批人套现离场，在全球买地。　　近期，国内一线房地产基金公司五牛基金正积极拓展海外投资的全球配置和资产证券化业务。　　“全球资产配置正在成为高净值人群在中国的标准投资配置。 ”五牛基金高管孔全宇说道。　　此前，五

06-18
国鼎资本：蛰伏在军工行业的狙击手

在这个“资本寒冬”的喧嚣时期，军工行业成为为数不多的仍在逆势增长的行业之一。 2017年国防开支增长7.5%，达到约1.19万亿，连续三年超过万亿。另一方面，随着国家允许私营企业成为军事装备供应商政策的放开，万亿规模的蓝海即将出现。 12月6日，北京中科海正数字技术股份有

06-18
“合肥制造”高端硅元器件将填补国内空白

世界制造业大会期间，合肥精工（合肥）有限公司集成电路配套产业园建设项目落户合肥经发区，使合肥成为“中国集成电路之都”增添了新引擎。如今，该项目生产的半导体硅材料加工产品已进入样品试产阶段，将填补国内高端硅元件产品的空白走进合肥经开区集成电路产业园，映入眼

06-06
诺辉健康全年总收入过20亿，首年实现税后盈利

诺辉健康年总营收突破20亿，第一年就实现税后盈利。 2020年1月22日——杭州，耀明健康（.HK）今日在香港联交所收盘后发布年报盈利预测：根据审前财务中位数数据，截至12月31日，集团净利润全年总收入达20.1亿元，同比增长%，回笼现金超过14亿元。公司全年毛利18.4亿元，首年

06-17
为帮助创业者走向全球市场，阿里云推出“阿里云海外沙龙”系列活动

二十年来，互联网给无数中国企业和创业者带来了前所未有的机遇。这些企业和创业者利用互联网的优势，创造出丰富多彩的产品和服务，成功开拓国内外市场，实现了跨越式发展。随着全球经济一体化进程加快，与全球新经济生态更加深度对接已成为趋势。广阔的海外市场、巨大的用

06-18