早在半年前,社交网络上流行着一张图,说谁是数字化转型最大推手?是CTO吗?是CIO吗?都不是,而是这场疫情。

虽然是个有趣的调侃,但也不无道理,在疫情面前,数字化转型现实意义更加明显。

2020年11月18日,“2020中国数据与存储峰会”在北京举行,吸引了线上线下数千名行业内人士的共同关注。

在主题为”云存智用,数字转型”的高端对话环节,北京建工集团信息管理部副部长杨震卿、平安科技副总工程师王健宗与浪潮存储资深架构师叶毓睿、阿里云资深技术专家吴忠杰,巧妙地从云(阿里云)、存(浪潮存储)、智(平安科技)、用(北京建工)四个不同的纬度,与主持人DOIT总编宋家雨一起,共同就数字化转型的方向、低延时高性能存储的瓶颈突破、人工智能技术的创新以及存储行业如何应对数据快速成长提供个性化的解决方案等话题进行了交流。

主持人:欢迎各位嘉宾。在激烈的市场竞争中,把握主动是重要的,所以在我看来最重要的推手还是CIO和厂商的专家学者。

首先请北京建工集团信息管理部副部长杨震卿讲一讲,你们往哪转,目前基于数据创新你们有什么样的动作和需求?

杨震卿:我们是一个施工的传统行业、国有企业,现在我们规模是1000多亿元,有4万名职工,北京长安街两侧80%的建筑,北京7000公里道路都是我们做的。我们做了几个有意义的事情:北京7000公里的道路哪个部分有问题我们能抓出去维修处理。刚才谈到了疫情,疫情期间的医院,53天我们建成,在这过程当中,我们实现用BIM技术解决。

类似的案例其实还有很多,聚焦到建筑行业,今年我们和十三个部委联合颁发了一个文件,叫做“智能建造和智能化发展”,这就是未来“十四五”期间施工类企业数字化转型的一个重要方向,我们主要是往这个方向转,智能建造的领域到底有什么内容,管理信息化、生产信息化、智能装备等等都是我们要做的工作。

主持人:确实安贞医院的建设速度让我们感到很惊讶,也让我们见证到了数字化的魅力。平安科技的王总,你们作为金融企业,我知道你们提到了联邦学习的制度,你们为联邦制度做了什么,有什么创新?

王健宗:今天论坛主题是“云存智用”,正好我的博士生导师谢长生教授也在会场,因为十年前他就带着我们做这个方向,我也完成了国内当时最早的一批云存储的博士生学习,就是后面的智用。

我从事金融的AI行业,对于金融来说,它对于AI的需求是相比其他行业有很迫切的需求,很重要的一点,因为以前我们做风控和用户的推荐,比如你要到门店,要去一个企业决定他是否贷款,要到现场走,成本很高,现在我们基本上不会做这样的工作,基本上全部是数字化,引用一个非常时髦的,数据孪生,完全是每个企业、每个人都有一个数字化的报表在我们后台。我们一直在做相关的工作。

到现在这个阶段,个人和企业的数据更多,大家也知道,整个行业的监管,包括对数据的安全保护,数据的个人公民隐私越来越重视,所以在这样的背景下,我们就开拓了如何保证隐私的情况下做一些数据的自用和数据的挖掘、机器学习和人工智能的工作,衍生出了联邦学习的工作。简单讲,就是我们可以应用在数据不用完全合到一起的情况下,实现数据的挖掘,机器的学习,这样就有效的避免了因为数据隐私安全带来法律的风险,也是重点突破的一块,下午有一个论坛会可以详细的汇报和介绍。谢谢。

主持人:刚才王总说到了数字孪生,我们每个人可能都有一个孪生的数据对象,跪羊图网盘想不想知道你们个人在他们的画像里是怎么描述我们这些人的行为和习惯的,我想这就是智能应用给业务带来的机会。在建筑设计或者整个建筑行业,现在在人工智能和智能应用方面,杨部长有什么样的想法和需求?

杨震卿:还是比较多的,我们叫全产业链,或者全生命周期,从设计勘察阶段,这个行业技术有一个概念模型,通过AI可以把建筑之前有多少人要被拆迁,他们的家庭情况怎么样,怎么组合户型图,大体的卫生间和客厅多大,设计完了以后的成果会传递给施工,施工就会预知要做哪些事情不做哪些事情,哪些可以保证工程安全,因为国家在推装配式建筑,所有的构件都是工厂里预先生产出来,哪些构件什么时间运过来,这个过程当中我们会用到大量的工程机械,运输环节和生产环节和现场建造环节,包括民工(我们这家企业大概有十几万的农民工在干活施工),这些人的管控也是问题,尤其是疫情期间。

我们说,疫情期间是统计农民工数量最准的阶段,因为一个人出问题会带来巨大的连锁反应。如何统计哪个人在哪,从哪个地方来的,和哪些人有接触,干什么工作,是不是有上岗资格证,最后向用户交付,以前大家买房子得到的是一个平面图纸,现在我们给到数字,人家哪一扇窗户更适合养花,我们都告诉。

主持人:这种设计的技术,或者建造和管理的技术,刚才王总说了数字孪生,数字孪生是用户的数字,把居住人的数据和信息能够跟建造过程结合在一起,大家可以想象未来有多么大的发展的空间,这就是给我们带来的想象空间,但是所有的想象空间都离不开我们数据基础设施的支撑。

今天一上午很多的厂商专家都介绍了存储技术的发展,数据保护的发展,但是我还是想请浪潮的叶总稍微总结一下,就是为了支撑前面的这些数据化创新,结合现在我们的技术,如何引起现有的用户格外的对技术的关注?

叶毓睿:首先我很高兴,今天话题“云存智用”,也是浪潮存储近几年提出的理念,叫做“云存智用,运筹新数据”。

我知道,王总是联邦学习团队在整个国内也非常出名,可以看成一个智的代表,今天咱们的四位刚好是分别代表了云、存、智、用,是一个很大的巧合。浪潮存储作为一个基础设施的提供者,举例子,比如说我们经常会去出差的时候,会有一个14天行程跟踪,作为用户的体验,我们希望达到什么程度,我觉得刚好是可以体现整个数字化转型的过程,比如一刚开始我们还是需要去手动的填写,首先你要完成信息化,信息化之后需要去把数据实时的在线,才能做数据的处理,以及数据的流动和数据的共享。这些都做完了以后,才能去上升到智能部分,进行决策和分析,包括数据的呈现。

比如现在14天行程,你去到哪个地方自动的推送,就不需要我们输入了,这些都会使得我们整个使用过程里,生活当中有很大得便利。

这里对基础设施会提出什么样的挑战,如实时在线,就需要我们的数据能够云化,在做这样的决策和分析的时候,需要做一些AI的训练, AI的推理,对于存储的挑战,比如说在存储层要和云化做对接,公有云做混合云的数据的流动,比如有云网关和云备份的机制,在私有云化里,要匹配是商业的云管或开源的云管,对接云的接口,比如DevOps和STD,比如云化容器化的部分,要对接CSI等等的接口。

在AI训练部分,我们发现,海量的小文件以随机的读为主,其实它对存储也有一些挑战,比如说存储可以支撑很高的OPS需求。另外在AI的推理会希望你能够快速的响应,对于存储的低延时高性能也要相关的要求,浪潮存储在这方面也做了相应的解决方案

主持人:所以最重要的首先是涉及数据采集,采集了以后要支持上云业务的应用,不同的应用系统之间怎么共享数据,大量的数据怎么样去满足机器学习和人工智能应用的需要,这些应用基础的变化,都需要后台的基础设施支撑系统要考虑到这个应用,不同的应用有不同的特征,但是你的技术不要成为整个数据应用的瓶颈,这个非常重要,也需要考虑特别多。

今天我们说数据创新,今天说AI,离不开云,是不是所有的数据往云里存,其实是不是只有公有云,是不是还有混合云,应该有公有云和私有云,在云的应用方面,可能阿里比较有代表性,请讲讲怎么在云的方面考虑一些问题?

吴忠杰:我给大家讲一讲,因为刚才大家说的是数据驱动,实际上数字化转型是各行各业都在搞的,跑得比较快的就是阿里巴巴的电商和蚂蚁金服,这些是完全数字化驱动的。

刚刚过去了双十一就会体会到,今天就是一台大型的无人值守的机器在那做双十一,这就是完全数据驱动。从后台的感觉来看,冲击还是很大的,实实在在的改变了我们的社会的运作模式,把这种方式在延伸到其他的行业,可能会发生很多质的变化。

从数字化转型来看,它需要云的基础设施,阿里云就是做基础设施这一块的,目标就是把它做成水电煤,分为计算、存储、网络,计算就是云原生,网络就是全球互通的一张网,而且是虚拟化的网络,存储我会重点讲,尤其是刚才提到的问题,是说云存储到底和以前的存储有什么样的差别。

我是做技术的,从技术的角度来看,这两个是完全不一样的东西,主要有两个因素。

第一个,由于在设计云存储系统的时候,面临的物理场景不同,因为面临的是数据中心不是一个单一的孤立的数据中心,是一个全球的数据中心,这样使得以前的存储系统设计的时候,可能是面向一些集群的服务器,或者说一些定制化的硬件,它的规模等等都不一样,这是第一。

第二,它面临的场景不同,传统的存储在设置的时候,可以做一些垂直化的设计,垂直化设计可以做很深度的面向业务的特定的优化,包括软硬件的优化,但是云存储是一个平台,所以我都不知道它上面跑什么样的应用,比如说数据库应用,数据库对延迟要求很低,还有一些大数据的应用,大数据应用吞吐带宽要求很高,双十一的搜索应用,要求就是峰值要求很高,所以这种应用在云上面都是要解决的,事先我也是不知道它的应用特征。

云有一个很重要的特征,就是弹性,所以它对云存储的技术架构来讲,你必须得做到有一个很好的弹性、可扩展性,必须是一个统一的平台,如果不是统一,改天有新的业务出来,我不可能再去垂直化的打造一个系统,可复制性很差,所以新的业务出来后,我一定会是在现有的架构上增长出来的,所以这是一个和传统存储或者说以前做存储架构的时候很大的区别。

主持人:你谈的云存储更多是公有云的存储,其实阿里不能用公有云来看,因为阿里也在往传统的混合云做,贴吧注册需要什么也在传统的公有云私有化部署,最大的中文您说的存储一定也包括私有云存储,私有云存储是用什么样的方式构建的。

吴忠杰:所有的公有云和混合云都是一套架构,所以以前阿里云有说是公有云私有化,就是统一架构的意思,所以不会做不同的垂直化的架构。

主持人:平安科技的角度,对刚才讲的所谓的统一架构混合云的部署,你们是怎么样看的,你们的应用过程会用到这种架构吗?还是按照你们自己部署自己的架构?

王健宗:从我以前研究云存储的经验来看,统一架构肯定是大势所趋,包括通过微服务的方式,包括云原生的方式,其实每个私有云都要去搭一个架构,这样对企业来说,成本太高了;服务成本太高了,要有一个统一的弹性架构,相当于云存储的超市,每个企业选购的时候,要公有私有不同的能力和不同的存储介质和需求,你挑就可以了,已经是这样的方式,这样才能规模化的快速的部署复制,并且能够运营,这应该是大势所趋。

杨震卿:我们有一些想法,但是付诸实践还是有点少,方向来说,就是混合云的方向,当然我们希望统一架构最好,但我们面临一些现实问题,因为我们自身产业线条会垂直比较多,之间会有壁垒,同时我们服务不同的甲方,比如说我们为海航服务,每一家也有自己的选择,这个时候我们的选择实际上还要根据甲方的选择走,因为我们更多的是希望这些架构能能把上层打通好,不能应所有的供应商,是要供应商适应我们的业务需求。

宋家雨:统一架构到底统一到什么地方去,这是一个非常有意思的话题,是统一到行业云,还是统一到阿里云,混合云,其实刚才王总说了一个重要的话题,统一到一个非常重要的概念里,微服务化,其实微服务化的架构会把我们所有的领域打通,不一定要统一到某一个具体的场景方案上,但是用微服务化的方式,通过容器化的方式,解决标准化和业务快速发展,叶老师,从你们的角度,对于混合云和刚才我们谈到的话题,您怎么看的?

叶毓睿:首先我很赞同宋总提到的容器趋势,因为我有一个团队也是解决方案架构师,我们也观察到很多的行业,比如说像互联网通信行业,还有自动驾驶以及物流,以及看到用户确实有需求,在容器化的部署,所以我们存储也应对这样的挑战去开发了CSI容器存储接口,很好的可以去部署。

刚才提到了统一架构,从私有云的存储角度也提一下浪潮的看法。浪潮数据中心分两大平台,一个是集中式存储,还有一个是分布式存储,从我们接触用户的感觉来观察,在比较长的时间内,集中式存储和分布式存储会并驾齐驱,都会存活很长的时间,核心的原因是什么?比如说集中式存储已经出现了很长的时间,有二三十年了,它的稳定性可靠性,包括用户的使用习惯都会使得它会依赖这样的存储,尤其是当一些数据库,比如一些关键性的交易,或者一些关键性的生产系统,仍然选择集中式存储,包括在这里积累了一些习惯,通常我们把它叫做是小快数据,比如随机的小IO,但是要求延时很低,访问速度很快。

叶毓睿:还有一部分是大量的非结构化数据,今天有嘉宾分享80%都是非结构化数据,音频视频文档等等,它的资料很大,这个时候它所适合的就是分布式存储,比如浪潮的AS13000,对存储的挑战就是希望有一个弹性的扩展,包括数据海量进来以后,可能涉及到的一些数据的重构,都可以很好的处理问题。

越来越多的用户会应用AS13000的特性,它支持多合一,阿里云os手机支持文件对象和块,通信行业的用户,有一些智慧城市政务云的用户,有大量的海量的日志和记录的文件,可以采用对象的接口,比如我们在金融的影像平台,就有相关的用户,但是它同样还是有一些老的音频和视频形态的文件,用文件的接口支持,它也会有一些因为云化的需要去跑虚拟化的,比如他的客户操作系统的,可以通过块的接口,我们发现用户有些时候就把浪潮的AS13000看成是一个云的存储,但是就回到刚才所分享的,我们看小的块的数据,集中式的存储,海量的需要扩展的是一个分布式存储,未来是不是融合,也是可以值得探索的。

比如说网络的技术,RDMA,包括NVMe,能够成本降低,大规模普及,是不是可以走到一个新的形态,像分布式全闪,可以拭目以待。

主持人:今天我们说的技术,集中式也好,分布式也好,全闪也好,还有很多的技术其实核心要做一个基础支撑,支撑了以后要用云的形态交付。

刚才谈到了很多关于未来应用的拓展,未来应用的创新,基于数据的创新,目前要实现快速的迭代和微服务化的发展,应用需求的改变,云的发展趋势和基础架构的融合,其实是5G融合在一起的。关于这些内容,我知道还有很多的争论和话题。

今天时间的关系,我想今天台上的讨论就到这里,因为还有很多分论坛,希望我们大家也能够根据更多的交流。

“2020中国数据与存储峰会”为期两天,由百易传媒(DOIT)主办,以“新数智·新未来”为主题,特邀中国工程院郑纬民院士以及中国电子学会、中国计算机学会存储专委会、SNIA等单位的嘉宾,与西部数据、英特尔、浪潮、IBM、华为、戴尔科技集团、新华三、深信服、紫晶存储、青云QingStor、威固、Memblaze等领先供应商以及北京建工、平安科技、红星酒业等典型企业用户代表,探讨新数据时代存储技术发展趋势,分享数字化转型成果,共话智慧存储未来。