除了写诗外,他还拍电影,流媒体巨头Netflix正在尝试用AI制作电影预告片
06-17
近日,戈壁创投年度投资峰会在线上举行。
戈壁创投邀请LP及被投企业管理者参加会议,分享收获、探讨趋势、见证未来。
2019年,国际环境复杂严峻,资本市场波动剧烈,加上疫情影响,股权投资面临前所未有的考验。
在“危机”与“机遇”交叉的环境下,戈壁创投继续保持有条不紊的投资节奏,努力寻找那些能够突破、重生的伟大公司。
天谋科技创始人黄向东作了题为《智能制造转型下的新一代物联网数据库》的报告演讲。
他表示:在不同的工业领域,时间序列数据可以为工业企业创造巨大的利润增长点。
时间序列数据在工业场景中的市场潜力非常大,并且正在从工业场景向其他场景蔓延。
以下为黄向东讲话实录,由戈壁创投编辑整理,有部分删减: 大家好,我是来自天谋科技的黄向东。
天谋科技是围绕 Apache IoTDB 等开源项目构建的。
我们主要关注的场景是服务智能制造。
天谋科技主要聚焦工业物联网场景,提供时序数据管理和服务。
去年年底,公司获得红杉中国、考拉基金、戈壁创投、云智能等近亿元融资,并正式启动运营。
创始团队主要来自清华大学、加州大学伯克利分校、微软、德国Fraunhofer-Gesellschaft、德国法兰克福能源集团等一批核心数据库技术科学家和资深行业专家。
在过去的几年里,团队积累了30多项与时间序列数据管理和分析相关的专利,这些专利已经成为我们进一步发展的基础。
我们的目标是通过时序数据库管理系统的产品形式,帮助工业企业用户以及更广泛领域的用户以更低的成本从数据中挖掘更大的价值。
时序数据的价值 下面介绍时序数据在智能制造转型升级背景下的潜在价值。
智能制造,或者说产业服务升级转型,很多年前就被提出了。
2016年,Gartner发布的白皮书给出了反微笑曲线,从中可以看出,随着服务型制造的不断成熟,生产型制造的比重呈下降趋势。
在这种状态下,工业企业的进一步发展必然向服务型制造转型升级。
中国的工业产业也已经到了这样一个阶段。
要完成服务型制造转型升级,激发数据价值非常重要。
工业大数据是人们熟悉的术语之一。
工业大数据大致涵盖三类。
一是工业信息化数据,包括PLM、CAD、CRM等不同系统的数据。
简单来说,就是人产生的数据;另一种是跨产业链的跨境数据,比如雷雨、大风、沙尘等天气可能会阻碍工厂开工。
这类数据实际上并非来自行业本身,但这些跨界数据会影响和制约工业生产;第三类数据是机器设备数据,这是行业的主体。
,除了人,就是机器。
随着互联变得越来越好,机器和设备可以感知和收集越来越多的数据。
这些数据可以代表机器设备的运行状态是否合理,是否存在问题。
安全隐患等。
三类数据中,机器设备既是数据的产生主体,又是数据的消费主体。
首先,由于机械设备上有大量的传感器,可以收集设备本身的状态,这些机械设备本身就成为数据产生的主体;同时,有了这些数据,我们可以对生产制造做出决策和判断,比如是否需要及时调整,减少安全隐患,或者提高生产效率等,它们也是消费的主体。
数据。
这类机器设备数据就是我们一开始提到的时间序列数据,它展示了不同设备在不同时刻各个指标维度的变化情况。
这类数据的价值非常高。
工业互联网先行者通用电气(GE)2016年指出:“充分利用海量时间序列数据驱动产业创新、竞争和增长,是大数据技术给新工业革命带来的历史性机遇。
“在不同类型的工业领域,时间序列数据可以创造巨大的利润增长点。
以电力行业为例,电力有发电、输配电、用电等不同环节。
以前的自动化系统可以收集每个环节都有时间序列数据,但大多数只是用于一些实时监控,不会对这些数据进行深入分析,一旦我们收集、存储和分析这些数据,就会出现新的价值点——预测、根源。
例如,我们可以利用风机的历史数据对风电曲线进行建模,获取风机风向和发电量的变化规律,并进行原因分析、调峰填谷、改进调度等。
确定是否需要补偿风表误差,以风电场1.5万台风机计算,该技术每年将为业主带来1.5亿元以上的经济效益。
此外,在传统制造、智能交通装备等不同工业行业中,时间序列数据的存储、分析、管理和应用可以带来降本、增效、预测、降低风险等实用价值。
一般来说,时间序列数据只能监控而不存储,或者可以将所有采集到的时间序列数据存储起来进行挖掘和分析。
根据时间序列数据管理程度从低到高,挖掘的价值也从低到高。
的。
如果只看最新数据,可以做一些远程运维、状态监控;当收集部分历史数据时,可以对一些设备进行数字画像、健康评估、故障预测、备件调度等,甚至可以从运维性能反向驱动设计流程的改进。
数据管理的挑战工业中机械设备的顺序数据管理实际上是从自动化设备出现以来就已经出现的。
与现在的管理需求相比,唯一的变化是现在有大量的轻型设备,需要相应地收集这些数据。
同时,所需的采集频率大大增加,需要观察的指标数量大幅增加,数据的管理能力从原来的数万个测量点提升到数千万个测量点。
点……只有尽可能多地存储所有这些数据,才有可能分析和挖掘它们的最高价值。
在此基础上,很多边缘侧设备也变得越来越智能化。
过去,边缘侧设备仅起到收集数据并将其发送到云端的作用。
现在边缘侧设备开始有智能化的应用需求,所以也必须开始有数据。
管理能力,其次是端、边、云的协同。
最后还涉及到数据保存后如何更好的进行分析和挖掘。
这些是要求的一些变化。
我们研究的重点是工业场景。
时间序列数据在工业场景中的应用有其特殊的复杂性。
例如,虽然很多工业设备的使用寿命很长,但现阶段设备迭代升级非常快,可以采集或者需要管理的数据会不断变化。
这种情况用传统的数据库技术来管理会比较复杂,所以我们专门为此开发了一批适配技术。
另外,很多工业设备的个体价值非常高。
例如,一架C飞机有8万个测量点需要在试飞过程中采集;如果将电厂视为大型设备,一座电厂有几十万项指标需要管理;在我们目前工作的石油石化行业,仅一个调度中心就可能有上百万个测量点需要管理。
海量测点的管理需要数据库对复杂设备具有强大的建模能力。
另外,传统的关系数据库处理的是人生成的数据,而我们处理的是机器生成的数据。
机器生成数据的频率非常高。
每秒可采集数千次,可采集7*24小时连续运行。
这最终将导致机器数据成为工业大数据的体量主体,同时也是价值主体。
数据收集和存储之后,下一步要解决的就是如何让用户更好地分析、挖掘、查询、使用数据。
由于工业场景过于复杂,或者工业生产环境过于恶劣,我们收集到的数据可能会有偏差。
在这种情况下,我们必须考虑如何提高数据分析的有效性,例如对齐数据和执行缺失的任务。
值的填充;再比如,如果数据的到达时间与数据上的时间戳不一致,则数据会乱序到达。
Apache IoTDB可以支持时间序列的乱序写入,以帮助用户应对这样的现实场景。
,仍然可以压缩到很低的成本,高效管理数据,实现快速查询。
智能制造基础设施 目前市场上的一些竞争系统或解决方案在解决用户痛点方面存在问题。
基于关系型数据库,写入吞吐率和压缩比较低,模型比较扎实,不利于设备升级;基于key-value数据库,压缩和查询不友好,部署和运维复杂;而原生时序数据库在工业场景下性能不足。
我们的目标是提供新的解决方案,帮助行业用户解决数据存储、查询和使用的问题。
我们希望能够支持机器设备的海量数据读写,帮助用户以超低成本持久存储这些数据。
数据帮助他们对数据进行深入的分析和挖掘。
我们的最终目标是打造智能制造的基础设施。
现在我们的产品形态正在不断扩大。
核心仍然是开源工业物联网时间序列数据库Apache IoTDB。
其主要特点是高吞吐量、高压缩、高可用性,是物联网原生、端边云协同的产品形态。
天谋科技是年底成立的,但是我们的技术实际上是从那一年开始发展起来的,到现在已经过去了十几年的时间。
从底层数据文件,到上层查询引擎,再到分布式架构,完全是我们自研的。
此外,IoTDB产品也由我们团队主导,成为Apache顶级开源软件基金会旗下唯一的时间序列。
数据库项目。
依托清华大学的科研实力,我们不断创新新技术,持续在数据库相关领域的顶级会议上发表新的技术突破,确保即使在开源状态下我们也能保持在技术的前沿。
从产品角度来看,我们是第一个也是目前唯一提出端边云协同架构的时序数据库。
我们也是唯一专门定义物联网数据模型并解决其存储和查询需求的数据库。
可以实现每秒千万点的数据写入性能和十倍甚至一百倍的压缩率。
从用户角度来看,我们希望利用IoTDB帮助用户使用数据提高质量和效率,降低数据管理成本。
从用户角度来看,首先,开箱即用,不依??赖第三方系统和外部组件;第二,能够以低成本提供高性能的读写能力;第三,兼容市场上所有产品。
已经有一些来自其他开源系统的数据可以帮助用户尽可能方便地迁移数据;第四,拥有丰富的数据处理生态系统;五是提供“端-边-云”方案一站式解决方案。
对于IoTDB数据库来说,除了功能之外,性能也很重要。
天谋在写入性能、实时数据监控、历史数据查询等维度处于行业领先地位。
此外,我们还注意到,很多工业用户实际上不愿意投入太多的IT设备来管理大量的工业数据。
因此,我们也非常重视数据的低成本存储和压缩能力,自己开发了一套数据存储格式。
此外,如果用户只存储数据,则该数据就是“成本中心”。
当数据能够被有效查询和分析时,它就从“成本中心”转变为“价值中心”。
因此,我们为用户提供了大量的时序数据的查询能力,并实现全流程的数据管理,让数据治理变得更简单。
距离查询更进一步的是数据处理和分析。
我们为用户提供了一系列的分析算法包,包括异常检测、数据平滑、数据预测等功能,同时我们还集成了一些自研的时间序列数据计算能力。
用户可以开发和创建自定义函数来满足定制的计算需求。
总体来说,经过去年的建设,我们的时序数据处理能力已经覆盖了数据采集、存储、即席查询、批量分析等不同场景、不同生命周期。
同时,在整个过程中,我们允许用户将自己的分析能力与工业机制集成到我们的数据库中,并定制计算逻辑。
最后我们来谈谈端边云协同。
简而言之,我们打破了“将数据发送到云端,让云端处理”的传统模式,而是在边缘组织数据,然后发送组织好的数据。
到云端,直接使用云端即可,无需二次组织。
通过实验验证,我们发现在这样的场景下,CPU和网络开销都可以节省10倍以上。
当然,我们还提供了很多可视化工具和用户交互工具。
此外,我们还在继续与Apache大数据生态系统以及许多开源和闭源的大数据分析软件进行集成。

这些综合解决方案涵盖了采集、处理、分析、应用等不同阶段。
总的来说,IoTDB是我们的核心。
以此为中心,向外延伸出许多相应的产品形态和周边辅助工具。
“天、空、地、海”全覆盖 公司成立一年以来,已服务众多行业用户,覆盖电力、能源、智能制造、工业互联网等各个行业。
应用场景涵盖“天、空、地、海”。
天,与某卫星合作,解决卫星上的数据管理,并借助天地网同步数据;天,帮助商飞管理C试飞数据,今年是还在继续讨论如何进一步管理飞机边缘的数据;地面上的大部分场景,包括工厂、车联网、气象等,与中船合作,支持高效的存储和查询;在海外,我们正在与德国博世等一些公司合作,联合集成的产品在日本、新西兰、美国都有相应的用户。
上海地铁,我们用IoTDB替换了原来的15台机器,将原来3年的TB数据压缩存储到16TB,在硬件投入成本大幅降低的同时,性能也得到了大幅提升。
在交通领域,我们与长安汽车合作,构建了基于Apache IoTDB的海量车联网车辆状态数据查询系统。
目前,IoTDB已在三个月内实现了自行车信号的高效数据查询,使得诊断系统在相同硬件资源下的数据查询效率更高。
从几分钟到几秒。
另外,我们今年还和博世有合作。
博世今年推出了新一代自动化平台——CtrlX。
原来CtrlX不具备管理历史数据的能力。
通过将IoTDB与软件集成,我们使其具备了集成历史数据的能力。
现在我们也成为了博世力士乐的合作伙伴。
在工厂级应用方面,我们与湖南中烟合作,通过对全集团车间数据、工厂数据、设备数据的管理,帮助他们提高产能,减少不良包和物料损失。
寻找开源与商业之间的平衡 总体来说,天谋还比较年轻,但在过去的一年里,我们注意到工业领域时间序列数据的市场比我们最初想象的更大、更快。
所以现在我们一方面继续发挥开源社区的优势,另一方面也在加快更适合直接交付的产品化进程。
我们的项目本身已经从开源状态进入了商业化进程。
在这个过程中,我们不断建设开源社区。
社区活跃度、参与度和海外关注度都非常高。
但我个人觉得,如果一个团队想要自己的开源项目能够真正长期发展,慢慢成为事实上的标准,那么这个团队要么进入商业状态,要么有商业的外部力量来支持。
只有这两个,开源产品才能长久生存。
从我们的角度来看,首先我们注意到行业用户对时间序列数据管理的需求正在快速增长,其次核心技术都在我们团队。
在这种情况下,仅仅依靠外部商业化支持是不够的。
为此,我们选择在机制上进行创新,形成项目商业化的路径,确保为用户和社会提供更好、更稳定、更持久的产品。
对于技术软件来说,从更符合市场规律的角度来看,我个人认为开源很可能是基础软件的必由之路,或者至少是必须的。
对于是否永久开源,不同的人可能有不同的看法,但如果没有经历过开源,基础软件就很难进入公众的视野,尤其是难以被技术人员所信服。
例如,未经测试的新数据库会丢失数据吗?够稳定吗?在这种怀疑的氛围中,开源可以带来重要的认可。
第一,可以让更多的人知道有这样的产品。
其次,社区大量的成功案例可以给一些观望的用户信心。
这就是开源给技术软件带来的机会,这是毫无疑问的。
对了,值得一提的是,这也是我们选择Apache基金会的原因之一,因为Apache基金会的目标是做企业级、生产级的开源软件。
开源和商业化实际上并不矛盾,原因有二。
首先,开源为团队提供了一系列潜在客户的机会。
让我跟大家分享一些数据。
我们在2022年12月3日举办IoTDB物联网生态大会时,在前期报名的众多人中,有百分之十以上已经使用了IoTDB,还有20%到30%正在进一步研究和准备用它;另一个重要数据是愿意选择商业支持的比例已经超过50%,这意味着企业必须使用开源软件作为生产系统时仍然非常需要商业支持。
因此,对于2B产品来说,开源可以成为商业化的基础。
其次,我也注意到,很多公司说投资开源只是一个口号,但这样做最终会让开源对商业化的支持变得非常弱。
为了实现成功的商业化,公司必须对开源进行真正的投资,尤其是不要过度挤压开源社区。
综上所述,开源一定是商业化良好的支撑点;如果想让开源成为商业化的良好支撑,企业就必须真正对开源进行一些投资。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-18
06-18
06-18
06-17
最新文章
3月,腾讯《王者荣耀》在全球App Store和Google Play吸引了2.57亿美元,同比增长63%
生鲜传奇宣布完成数亿元B+轮融资
裁员20%?红杉中国回应:胡说,员工总数不降反升
第二次影视创新“闯”短剧世界:看、留、跳都是钱
ASML:从飞利浦弃儿到光刻之王
宁康瑞珠获数千万元A轮融资 横琴金投、翰颐资本投资
智能金融服务生态平台科客完成A+轮融资
拼多多九鼎:信息披露无懈可击,竞争对手才是“浇水”的