腾讯云大数据产品中心总经理刘宇红:企业级数据体系建设(附完整PPT)

发布于:2024-10-24 编辑:匿名 来源:网络

背景:5月23-24日,以“欢启”为主题的腾讯“云+未来”峰会云计算大会在广州召开,广东省各级政府机构领导、国内外业界学术专家、行业领袖和技术专家在现场共同探讨云计算和数字产业创新发展。腾讯云大数据产品中心总经理刘宇红在24日下午的AI大数据专题论坛上介绍了大数据时代背景下腾讯如何构建全球数据体系。

今天我们论坛的名字是AI大数据。我们前面的嘉宾讲的是人工智能,我主要讲的是大数据。

AI确实非常强大,可以帮助各行各业解决不同场景下的很多问题。如果说人工智能是武器,那么大数据就是弹药。

没有弹药,武器就很难发挥应有的作用。我今天的主题叫《全域数据体系建设》。

什么是全球数据系统?每个人的理解可能不同。有两种理解,横向的和纵向的。

一是各行业、各领域的融合。比如旅游大数据可能包括文化、交通、餐饮、住宿、保险等行业,全部整合在一起,这就是全球大数据的概念。

还有一个垂直的概念。比如从数据的生命周期来看,数据是从我们业务的线上系统产生的,然后流向我们的分析系统,比如大数据平台,或者数字仓库;然后到应用平台,比如在AI应用平台中进行各种应用,最后返回到我们的线上系统,形成一个循环。

这也是一个全球数据系统。如何构建全球数据体系?众所周知,腾讯其实有很多类型的业务,包括支付、社交、游戏等,这些数据如何整合在一起呢?我们十年前就开始研究大数据。

当时我们就想把腾讯所有的业务数据都整合起来。当然,这不是一件容易的事,而是非常困难的。

数据如何使用,如何采集,进来后如何保存,保存后如何管理,管理后如何使用。众所周知,腾讯拥有大量数据,而且数据形式各异。

比如有的数据比较完整,有的业务甚至不写日志。如果我们想要获取数据,就需要使用在线业务系统。

大家都知道腾讯代理了很多韩国或者其他地方的游戏。当我们发现数据不全,想改的时候,商家说找合作伙伴。

我们应该等一两年才能找到韩国人。开发团队甚至可能被解散。

这种情况经常发生。类型的问题。

数据质量参差不齐,这是我们遇到的一个巨大困难。还有一个困难。

我们实际上面临着人才短缺的问题。我们本来是做业务系统的,但是没有人懂大数据。

我相信很多企业都面临着我们以前遇到过的同样的问题。现在回想起来,我们基本上解决了这些问题。

从技术上讲,腾讯所有业务的数据都集中在这里,而且从技术上讲,这些数据是互联的。但它与业务逻辑隔离,非常安全,而且只要授权就可以随时访问。

大家可以看一下目前整个大数据平台的数据量。我们的平台每天接收13万亿条数据,平台上的各种实时计算每天超过3.5万亿次。

为了支持离线任务,我们的资源调度系统每天启动1.5亿个容器。我们的数据量超过PB。

为了支撑这么大的体量,我们动用了3万多台支撑机器。我们的梦想已经实现了,但是可以看出,实现这个梦想还是非常困难的。

我们用了近10年的时间、大量的青春、大量的人力、大量的硬件资源来做这件事。接下来我想从数据生命周期的角度分享一下我在刚才提到的全球数据的三个方面的经验:在线系统、分析系统和数据应用。

众所周知,一般业务系统的在线系统和我们分析系统的数据是隔离的。线上系统是一套数据库,还必须搭建另一套数据仓库来进行分析。

许多企业仍然这样做。我们从两年前就开始尝试,希望把在线系统和分析系统整合起来。

我们开发了一个名为TBase的系统,它是一个New SQL HTAP分布式数据库。我们希望统一在线交易处理和离线分析系统的数据库。

现在腾讯,包括微信支付,也在使用这个数据库。此外,TBase也已经发布,并通过腾讯云向大家开放。

该数据库支持OLTP和OLAP的集成。 TP上每分钟可处理10,000笔交易,AP分析性能比行业基准高约5倍。

在线和分析系统的融合应该算是当前数据库发展的趋势之一,也是我们的经验。第二步,我们的大数据平台主要是支撑分析系统。

这里最困难、最突出的问题就是刚才提到的数据治理问题。我们的业务非常多,种类很多,而且业务也有很大不同。

每个企业对数据的理解和使用都不同。数据是一种资产,这个资产非常重要,所以我们必须保证我们平台中数据资产的安全和质量。

他们不会错,也不会迷失。数据从哪里来?它流向哪里?数据与数据之间是什么关系?我们都需要了解血缘关系和关系。

腾讯内部业务非常庞大,而且非常独立。我们如何将以前不规范、混乱的数据变成现在更加有序、有效管理的状态?我有三点经验可以分享。

第一,人性化服务。我们花了很长时间整理资料。

我们花了近三年的时间帮助各个业务组进行系统迁移。我们派人坐在他们旁边,帮助他们在各个业务上啃骨头,帮助他们整理和迁移报表。

二是搭建实时数据采集平台。我们从源头收集数据,这样我们就可以控制数据的质量,跳过很多中间环节,自己制定各种数据标准。

第三,我们搭建一个平台给他们使用,我们提供非常强大的计算资源。在这里,我们收集了来自许多其他不同企业的数据。

企业希望连接到我们的平台,享受数据交换的好处,并从我们庞大的资源支持中受益。他会与我们联系,我们会制定规范,这样他就必须遵循规范和标准。

这是我们在数据治理方面的三个经验。分析系统的背后是我们的应用程序。

腾讯的业务那么多,每个公司都想做个性化的应用、个性化的推荐,包括内容和广告推荐,还有游戏中的个性化道具推荐。每个企业都想自己做,所以我们做了最基本的事情。

我们将所有与用户相关的数据汇总在一起。我们从最底层的用户画像开始,建立了一套以用户为中心的用户画像。

支持上层业务发展。底层的基础必须打牢,才能很好地支撑上面的应用。

该用户画像现已支持腾讯全部效果广告,每年带来10%以上的精准效果提升。不要低估10%。

这每年大概有几十亿的收入,还是很可观的。我们必须打好底层数据基础,才能更好地实现上述应用。

我们想把它变成一个数据服务。现在这个服务也是通过腾讯云开放的,叫数字营销。

大家可以尝试使用一下(他二哥注:可以点击公众号菜单中的“技术平台”-“应用”找到这些数据服务)。回顾大数据平台的发展,我们经历了离线计算、实时计算、机器学习三个阶段。

从数据的角度来看,我们都是去中心化的系统。这个系统用于存储,另一个系统用于缓存。

,还有一个做多维度的查询分析,都是分散孤立的,各个数据不互通。后来我们把从数据采集到存储再到可视化的所有数据整合起来,变成了一个套件。

然后我们把这个套件变成一个每个人都可以访问的平台,把它变成一个面向服务的东西,每个人都可以调用我们的服务。在应用方面,我们也符合AI的趋势。

我们在上面搭建了机器学习平台,向智能应用方向发展。本来我们是一个通用的数据平台或者机器学习平台,但是现在我们和行业的结合越来越紧密。

我们根据垂直行业的不同场景需求,为他们提供各种解决方案。发展主线是从碎片化到融合、从通用平台到场景化。

现在我们已经开放了这样的平台。我们将数据收集、分析和挖掘扩展到可视化。

我们通过腾讯云打通了全链条的所有平台。我们希望能够加快大家数据处理的效率,帮助全球体系中的每一个人。

施工时可以使用它。今年7月份的云+未来峰会上我们也发布了一个大数据产品,叫大数据套件——TBDS。

刚才也说了,过去我们很缺人才。很多企业也面临这个问题。

他们想做大数据,但没有大数据人才。该产品让您无需大数据人才即可使用大数据平台。

这就是这个产品的初衷。我们最近更新了很多,对最重要的数据管理功能做了很多改进,今年我们的版本也更新了。

我们在它上面做了很多服务和工具来提高大家的使用效率。值得一提的是,我们不仅支持腾讯内部版本,还兼容业界比较流行的CDH和HDP版本。

除了平台的开放之外,在腾讯云上,如果你留意的话,你会发现很多数据服务,不仅仅是平台,还有数据服务。比如移动分析服务会分析很多APP的行为,还有反欺诈服务,还有其他一些数字营销服务和LBS地理位置服务。

这是可以向用户提供的数据服务。云用户可以将自己的数据与我们的数据服务集成,构建自己的全球数据系统。

这样,它不仅仅是你自己的数据,还可以与其他数据融合、跨界。平台是开放的,我们的数据服务也是开放的。

在云中,不仅仅是平台和服务,还有生态系统。我们有能源、交通、教育等很多行业,这里聚集了各个行业的用户和服务这个行业的开发者。

这是一个真正繁荣的生态社会,每个客户都能找到跨界的可能。例如,能源可以与交通、气象服务结合,更好地服务客户。

就像腾讯内部一样,我们建立了一个大数据平台,整合腾讯内部的所有产品,比如游戏、视频产品,从而产生更多的创新。在我们的云里,每个人都可以做同样的事情,找到跨界的机会,产生更多的创新可能性,挖掘更多的数据价值。

最后,这是一个例子。在昨天上午的圆桌论坛上,中国银行行长也提到,中国银行利用腾讯的一些数据分析能力和我们的平台能力,结合一些公共网络空间数据服务。

他们提供了一些舆情数据服务,升级风控体系,进行风控体系的各项创新,强化风控平台。这是我们使用平台使用我们的数据服务与很多行业的传统场景相结合时发生的化学反应。

这样的案例将会越来越多。我们也希望通过我们的平台能力和我们的数据服务结合你们很多的业务场景,能够产生不一样的效果,带来很多创新。

我们也希望帮助大家发现更多数据的价值,这也是我们做大数据的梦想。这就是我分享的,谢谢大家。

腾讯云大数据产品中心总经理刘宇红:企业级数据体系建设(附完整PPT)

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 小米14即将推出高通骁龙8 Gen3,与之前的8系列旗舰芯片有点不同

    小米14即将推出高通骁龙8 Gen3,与之前的8系列旗舰芯片有点不同

    虽然在本次高通骁龙峰会上,PC芯片骁龙X Elite抢了很多骁龙8 Gen3的风头,但安卓手机唯一的旗舰芯片,加上小米14系列即将推出以及性能限制的解除,也帮助骁龙8 Gen3重新获得了人气。 步伐先进,人工智能主导。 今年的骁龙8 Gen3确实与之前的8系列旗舰芯片有些不同。 今年,高

    06-21

  • 新消息!成大生物、中数智汇科创板IPO提交注册

    新消息!成大生物、中数智汇科创板IPO提交注册

    4月7日,获悉,辽宁成大生物科技股份有限公司、北京中数智汇科技有限公司在科创板提交注册。 科创板IPO。

    06-17

  • 法律重回春天,房产投资价值愈发凸显 -歌斐地产4月观察

    法律重回春天,房产投资价值愈发凸显 -歌斐地产4月观察

    要点概述:根据中国人民银行4月份发布的城镇居民家庭资产负债调查报告,居民资产主要是实物资产,其中70%是住房;每户拥有1.02套住房,近60%的家庭拥有一套住房(因此未来改善需求将占主导地位);家庭负债率总体稳定在45%,但流动性不好(实物资产占比高,金融资产占比低)。

    06-18

  • Masdar赢得亚美尼亚另一个200MW太阳能项目

    Masdar赢得亚美尼亚另一个200MW太阳能项目

    阿联酋政府拥有的可再生能源公司Masdar将在亚美尼亚实施另一个MW太阳能项目。 该协议是在亚美尼亚总统阿尔门萨尔基相和马斯达尔首席执行官穆罕默德贾米尔拉马希会晤时达成的。 会议讨论了可再生能源、最新技术、科教领域的合作前景。 萨尔基相总统强调,在亚美尼亚可再生能源

    06-08

  • 关于 Google X 实验室的现在与未来,“登月队长”  Astro Teller 是这样说的

    关于 Google X 实验室的现在与未来,“登月队长” Astro Teller 是这样说的

    关于谷歌的现在和未来,我们都无法回避一个名字——Astro Teller。 这位被称为“登月船长”的传奇人物已在这个实验室与知名员工一起工作了五年。 泰尔的简历就像一个疯狂的科学家。 他在卡内基梅隆大学获得人工智能博士学位,创立了健康体征数据公司 Body Media,后被 Jawbon

    06-17

  • 神州云动cloudcc:利用CRM大数据技术帮助企业脱颖而出

    神州云动cloudcc:利用CRM大数据技术帮助企业脱颖而出

    在当前的“互联网+”时代,客户已经成为企业最宝贵的资源,也是决定企业生存的最关键因素。 为了争夺客户,许多企业使出浑身解数,利用一切营销渠道。 网络广告、移动营销、搜索引擎营销、网络视频等数字营销渠道已占据当今企业营销的主流。 然而,往往即使有这些营销努力,带

    06-18

  • 小红书和抖音上那些让你拥有“财务自由”的副业,如果赚不到钱,可能就要付出

    小红书和抖音上那些让你拥有“财务自由”的副业,如果赚不到钱,可能就要付出

    年轻人这次特别“摇摆”。 他们孤独、渴望爱情,但也害怕婚姻和养育孩子的压力;他们讨厌熟悉钓鱼,但又想利用业余时间经营副业;他们想要生活幸福,但他们会焦虑,深夜无法入睡。 年轻人很难,但困难并不是不收获的理由。 在这个“副业刚需”的时代,有人趁着年轻人的焦虑,

    06-21

  • 酒店云PMS厂商“绿云”完成1亿元D轮融资

    酒店云PMS厂商“绿云”完成1亿元D轮融资

    据投资界(ID:pedaily)3月9日消息,杭州绿云软件有限公司(以下简称“绿云”)绿云”)宣布完成D轮融资,金额为1亿元人民币。 本轮投资方为海港天成基金,由同程旅游(.HK)、海港集团和青岛市、区引导基金共同发起设立。 鲁云董事长及CEO杨铭魁表示:D轮融资将用于行业数字

    06-18

  • AI增强夜视公司“知未来”获数千万元A+轮融资

    AI增强夜视公司“知未来”获数千万元A+轮融资

    投资界(ID:pedaily)3月19日消息,AI增强夜视公司“知未来”近期完成数十轮融资数百万元A+轮融资,本轮融资由景泰资本投资。 融资资金将用于技术研发和全球市场开拓。 此前,智造未来已完成梅花创投、大辰资本、国宏嘉信等机构的多轮融资。 智富未来成立于2007年,主要技术

    06-18

  • 东车日报 理想L9官方外观图片发布-特斯拉、比亚迪再次涨价-丰田、日产部分工厂因地震停产

    东车日报 理想L9官方外观图片发布-特斯拉、比亚迪再次涨价-丰田、日产部分工厂因地震停产

    介绍 理想L9官方外观图片发布 AITO文杰M5四驱旗舰版将上市从北京车展公开订购时需显示ID。 Aero概念车、奔驰发布EQS SUV内饰、官图、上汽荣威发布SUV新车型:鲸鱼、特斯拉上调Model Y后驱版价格、比亚迪发布第二次调价,郭明錤解释:苹果车团队必须重组现代汽车在印尼建厂生产

    06-21

  • 三迭纪完成Pre-C轮1.5亿元融资,国信投资

    三迭纪完成Pre-C轮1.5亿元融资,国信投资

    投资圈(ID:pedaily)领投 据9月28日消息,南京三迭纪医药科技有限公司(以下简称“三迭纪”) :三迭纪)宣布完成1.5亿元Pre-C轮融资,主要用于加速3D打印药物管线的临床研究以及3D打印药物技术的商业化进程。 本轮融资由国信投资领投,高脉联合家族办公室及老股东东富龙科

    06-18

  • 招人“难”吗?用人“贵”吗?制造业就业的AI机会来了

    招人“难”吗?用人“贵”吗?制造业就业的AI机会来了

    为什么劳务行业没有自己的“海底捞”和“三只松鼠”? “事实上,他们抓住了内部管理之外的服务升级,创造了自己独特的品牌价值,以低廉的价格吸引了更多的客户,从而扩大了规模经济;在不断加大研发投入的同时,也提高了公司的核心竞争力。 服务升级、管理升级、品牌升级是劳

    06-18