深圳:2023年集成电路产业收入预计突破2000亿元
06-06
世界正在进入数字经济蓬勃发展的时代。
数字工业化、产业数字化正在推动实体经济和数字经济融合。
数据已成为关键的生产要素。
5G、4K/8K视频、物联网、自动驾驶等新连接和新应用正在加速数据产生和流动。
数据计算、存储、数据库和大数据技术不断突破、相互融合,最大限度地发挥海量、多样化数据的价值。
据雷锋网报道,近日,在华为主办的全球数据基础设施论坛上,华东师范大学的副校长;数据研究所创始人院长和教授;中国计算机学会(CCF)数据库委员会副主任周傲英发表了题为“《中国未来需要什么样的数据库》”的主题演讲。
周傲英教授深入浅出地讲解了数据库的发展历史,阐述了他对数据库发展趋势的理解。
他提到,过去40到50年,数据库取得了巨大成功,但也吸取了深刻的教训。
至此,数据库系统可以解决所有问题的想法已经被放弃了。
互联网给中国数据库市场带来了新的机遇。
应用驱动创新,应用推动技术进步,技术又倒逼应用发展,形成联动的良性循环。
以下为雷锋网整理的周傲英教授演讲实录(雷锋网现场编辑整理,未经会议官方或演讲者确认)。
周傲英:朋友们,我很高兴来到深圳参加全球智能数据基础设施论坛。
今天我要跟大家分享的是《中国未来需要什么样的数据库》,即中国数据库面临哪些机遇和挑战。
从数据库发展和数据库历史的角度来看。
过去 40 或 50 年来,世界上的数据库发生了什么?未来我们将面临什么样的环境?我们应该做什么?这个过程中有一个特别大的变化,就是刚才侯总和胡总提到的数据。
“数据”是一个非常古老的词,那么为什么数据现在如此重要呢?数据库管理数据。
他们过去是管理数据的,将来也是管理数据的。
但这是因为我们现在对数据的理解超出了以前的所有理解。
这是我想分享的基本内容。
大家都会想到什么是数据库。
因为对于普通领导或者非专业人士来说,大家都说把数据放在一起就叫数据库。
最早的数据库称为Data Bank。
数据就像金钱一样存储在银行中。
但实际上,对于专业人士来说,我们知道数据库是计算机科学的一个非常重要的分支,因为数据库支撑着关键的核心业务。
支持关键核心业务意味着什么?也就是说,管人、管钱、管事,一定要管准、管准。
经过几十年的发展,数据库已经发生了巨大的变化。
随着关系模型、事务处理和查询优化,我们需要变得越来越高效和更快。
这就是数据库在过去几十年里所取得的成就。
我们在数据库的发展上取得了非常辉煌的成就。
这里列出了四位数据库创建者或先驱者(见PPT)。
第一个是Charies Bachman,他提出了数据库概念和DBTG报告。
目前数据库的所有概念、各种语言等概念几乎都是他在报告中提出的。
他是第一位数据库图灵奖获得者。
第二个是关系数据库,关系模型的提出者。
第三个是交易处理模型的提出者和第四范式的提出者。
第四个是来自伯克利的教授,他是很多数据库系统的开发者。
建筑的完美者。
(见PPT)我们回顾一下他们所做的工作。
来源是COBOL语言。
计算机刚问世的时候,最初是用来计算的。
使用COBOL语言后,发现它可以用于商业目的,例如会计和工资单。
COBOL 语言是一种语言。
当我们说话时,我们经常将处理语句和数据放在一起。
COBOL语言的数据量特别大,数据步长特别大,所以需要一个文件系统来管理。
当文件系统中的数据越来越多的时候,大家发现它是一种数据系统语言,于是就有了一种叫做CODASYL的语言,它让COBOL语言变得更好。
大家都熟悉COBOL语言。
如果你不熟悉的话,早在 2000 年,“千年虫”就是由 COBOL 语言带来的。
DBTG报告在COBOL语言会议上发表,因此Charlie Bachman获得了图灵奖。
这太简单了。
它只是一个数据关系表。
20世纪70年代提出了事务处理,这样在处理财务问题的时候,可以用一个通用的模型来处理,而不需要大家都去编程,这使得我们的稳定性和可用性更好。
数据库取得了巨大的成功,但也有深刻的教训。
这个深刻的教训是因为数据库的发展史实际上就是我们IT发展史和创新史的缩影。
因为所有IT,包括数据库,都是应用驱动的创新。
我刚才描述的是COBOL语言是为了解决银行的问题而发展起来的。
它用于推动创新。
我国现在注重创新驱动发展。
我们深知,对于IT来说,一切都是应用驱动的创新,首先是应用,然后是技术,最后是理论。
该应用的创新与技术的创新形成良性互动,形成良性循环。
数据库开发的教训是,这是我们数据库圣人总结出来的教训。
本来我们以为数据库系统可以解决所有问题。
但是大数据、Hadoop出来之后,数据库的人就认为我们的系统解决不了任何问题。
互联网出来以后,互联网是最大的数据库,但是我们的数据库在里面什么也没做。
然后我们总结经验,得出结论:有一种类型的应用程序有一个数据库。
抽象,从具体到抽象,我们把常见的东西、普遍的东西、本质的东西抽象出来,形成数据库。
数据库通常是抽象的。
从数据中抽象语义形成关系模型。
关系数据库的伟大之处在于它们将数据和语义分开。
我们在设计数据库的时候,需要设计第三范式和BC范式来抽象函数依赖。
这种模式反映了它们的语义。
我们对业务逻辑的抽象产生了事务处理模型。
如果一张票不是交给两个人,而一个账户转入该账户,则该账户必须在那里结算才能结束。
业务逻辑的抽象形成了事务模型。
数据库的三大成就是关系模型、事务模型和查询优化。
这两项重大成就都源于抽象。
抽象让数据库行业及其辉煌成为可能,但30多年来僵化的抽象却阻碍了发展。
大家都认为抽象得如此完美,这就是上帝的命定。
关系数据库几十年来一直主导着世界。
根本原因是我们认为它可以解决所有问题。
当大数据、互联网的概念出来后,大家发现并不能解决这些问题。
在数据库发展史上,存在着行业垄断的格局。
我们经常谈论三大支柱:Oracle、DB2 和 TERADATA。
开发新业态、新产品数据库难度较大。
我们知道这些数据库最大的特点之一就是难以Scaling Up。
在互联网时代,当我们谈论Scaling Up时,我们不仅仅依靠购买高端服务器和存储来向上扩展。
这就是数据库不适合当代的原因。
互联网改变了世界,互联网改变了世界,因为互联网改变了人。
马克思对人的定义,他说,人是社会关系的总和。
当人们改变时,世界就会改变。
互联网如何改变人与人之间的关系?因为它改变了人与人之间的联系,利用数据创造用户体验。
过去我们靠教育、教育来提升用户体验,现在我们靠数据、行为数据。
有人说,我们愿意用自己的私人数据来换取服务的便利。
为什么效果这么好?事实上,他获取了我们的私人数据和行为。
为什么互联网可以做到这一点?互联网是一个平台,任何人都可以使用它。
平等导致民主。
人工智能会再次流行,因为我们需要做精准营销,通过行为数据洞察人性。
最重要的手段就是人工智能算法或者深度学习算法。
马克思还说过,当一门学科使用数学时,它就成为一门科学。
当我说互联网时,就像中国人多年前呼唤的德先生和赛先生一样。
互联网尤其重要,因为它创造了大数据。
党的十八大后,以李克强总理为首的新一代政府上任时大谈大数据和国家战略。
有了大数据,我们就讲互联网+,明年我们就讲创业创新,明年我们就讲供给侧改革,明年我们就讲共享经济,明年我们就讲人工智能。
我三五年前就预测过以后会讨论区块链,因为区块链才是真正的互联网。
这是数据带来的世界趋势。
互联网为何带来如此大的变化?因为数据就是力量。
当谈到数据就是力量时,我们会想到Keowledge就是力量。
当我们现在谈论电力时,我们谈论的是电力,而数据是一种新的电力。

在数据权力之前,我们有两种权力。
最新的Power是“蒸汽能源”,早期的Power是“电能”,后者是“数据能源”。
只有有了蒸汽能源,才有第一次工业革命。
我们已经进入工业经济,随着电能的诞生,才能有第二次工业革命。
我们用过去30年的时间来弥补,现在我们面临着一个新强国的诞生。
在新经济背景下,刚才提到数字经济,我们认为数据是新的生产资料,计算能力是新的生产力。
一种新的力量已经到来,就像电力已经到来一样。
从蒸汽时代到电动时代的转变是未来,是重构的时代,一切都应该重新来过。
在我们这个时代,数据作为一种力量而出现。
我们看数据系统,Hadoop、Spark,它们都是为了解决应用问题,将其抽象成技术,通过开源来推广应用。
这就是数据系统的成长路径。
它和以前的数据库一样,但现在它活了过来,并在我们眼前告诉我们。
我们现在正处于一个非常重要的机会之窗。
资本主义经济中有一个理论,叫康德拉季耶夫循环理论。
资本主义经济会经历50年、60年的波动,新强国诞生后,前20年是准备设备、技术、理论的阶段,接下来的30年是广泛应用的阶段。
互联网已经存在20年了,未来30年对中国来说尤为重要。
这种数据力量能否充分发挥其潜力?我说中国数据库在这个时代面临重要机遇。
互联网非常成功地告诉我们,应用驱动创新,这是一条重要的路径。
应用可以推动技术的进步,技术又反过来倒逼应用的发展,形成良性循环。
这就是联动。
我们正处于一个升级的时代。
我们面临这样的国际形势,这就要求我们做替代项目。
替换工程与升级相结合的创新是最好的,我相信这也是华为最好的机会。
替换工程只是我们的影子,升级换代才是最根本的东西,再加上开源。
开源为这种持续发展提供了一个生态系统。
开源已经从最初的企业和个人的自发行为逐渐演变为企业的商业行为。
我现在觉得开源往往成为一种国家行为。
因为它根本上是一种文化和精神,它会形成一个国家的创新能力。
对于中国数据库未来的发展,我要特别注重对IT领域应用驱动创新的理解和讨论。
丰富的应用是我们最大的动力。
这应该是我们研究的出发点和落脚点。
在解决问题的过程中,我们形成了技术,建立了理论。
我们要做好顶层设计,营造健康生态,构建开源文化。
我们拥有巨大的技术和研究力量,我们拥有如此多的工程师。
大学那么多,但我们需要组织,需要指导。
打造健康的生态首先需要开放,而开源是必由之路。
只有通过基础软件和系统软件的模块化、堆叠化,才能实现开源,促进各方创新。
基础研究和原始创新需要艰苦奋斗、长期攻坚。
我们正处于数据库发展的最佳时期。
我们需要创新的商业模式、丰富的应用场景,需要华为这样的引领者。
我一直说数据库是信息社会的基础设施。
今天我们论坛的主题是“智能数据基础设施”。
如果数据被认为是一种新的力量,就像研究电力设施一样,我们正在研究我们的基础设施。
数据是新的力量。
我们有一个非常成功的方法论,需要全方位的方法。
我们不是在构建一个Oracle,我们是在为不同的应用程序构建量身定制的数据库系统。
中国数据库的未来在于开放的架构,而不是自满。
开源生态需要真正解决问题,更重要的是解放思想。
我认为开放是我们数据库走向自由的唯一途径。
谢谢你们! 【CNCC来了! 】 10月17日至19日,CNCC将在苏州金鸡湖国际会议中心举行。
本次会议由中国计算机学会(CCF)主办,苏州工业园区管委会承办。
CNCC,全称中国计算机大会,是我国计算领域规模最大、水平最高的集学术、技术、产业于一体的盛会。
该会议创办于2006年,每年在不同城市举办。
迄今已成功举办十五届。
会议形式包括会议特邀报告、会议论坛、技术论坛、专题活动和展览等,会议针对本文提到的安全芯片领域的最新趋势准备了丰富的内容,敬请关注。
如果您以个人身份参加会议,您可以: ? 通过官方网站cncc.ccf.org.cn注册参加会议 ? 申请论坛并以论坛主席或发言人身份参加会议 ? 申请参会经费此次会议。
申请人仅限于偏远地区高校的青年教师或学生。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-08
06-17
06-18
06-18
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态