阿里云张晓丹:为什么说金融上云不只是技术问题,还是经济问题?

银行的核心竞争力在于应用研发和业务创新,IT的事情留给IT人去做。

金融机构IT架构的“成长”中,有太多“阵痛”:

  • 从集中式演变到分布式,标准化、开放化的建设是有了,应用人员要操心的事为什么更多了?

  • 一台大机支撑上万台服务器,是很节能环保,但研发周期太长、售价太贵,一个性价比更高、更敏捷开放的替代方案是怎样的?

  • 银行如果不做全面上云,继续长期维持双模IT,不可行吗?

  • ……

在阿里云新金融事业部CTO张晓丹看来,谈金融机构的IT建设,谈云架构转型,其实不只是在谈一个技术问题,同时还是一个经济问题。

这场IT架构的云化改造,不仅事关时间、人力、物力,更关乎金融机构的人员能不能摆脱复杂架构的束缚,更加专注业务和应用的创新。

“整个IT基础设施交由专门的金融行业云承载,实现按需、敏捷、弹性获得算力以支撑应用创新。”张晓丹这样概括发展金融行业云的目标。

在雷锋网(公众号:雷锋网)《AI金融评论》与阿里云联合主办“银行系统云化升级”实战体验营中,这些围绕在金融云化周围的疑问被一一解开。

本次实战体验营的首日分享中,阿里巴巴集团副总裁、阿里云新金融事业部总经理刘伟光带来开场致辞,他表示银行业正在全面应变,掀起线上化、数字化、智能化的变革,无处不在的银行服务逐渐由蓝图变为现实。

此后,阿里云新金融事业部CTO张晓丹带来了首场演讲——张晓丹曾是工商银行总行部室副总级专家,先后在工行分行、数据中心、总行IT部门任职22年;在恒丰银行出任科技部总经理期间,建设了国内银行业第一家多租户的金融IAAS行业云,首次将一家全国性股份制银行的应用系统全部迁移上云。

这次,他结合自身二十余年在银行的IT经验,分享金融IT基础架构全面云化、机构应用迁云实录等干货。

以下为经雷锋网AI金融评论编辑的张晓丹演讲内容:

大家好,我今天分享的主题是《阿里金融云,新一代金融IT基础设施》。

金融IT基础架构的全面云化

整个金融行业正在面临着向数字化转型的大潮过程,这个阶段中,我们不断在发展在线化、数字化以及网络化、平台化以及智能化。转型过程对金融IT基础设施提出了更高的要求,需要我们能够按需、敏捷、弹性的获得更经济和廉价的算力。

传统的IT架构比较安全、稳定、可靠,但是其开放性、弹性、敏捷性、经济性存在一定的局限性,所以需要不断向云架构进行转型和升级。

在这个过程中,私有云、行业云、混合云,还有公共云具备各自的优、劣势。我们专门为金融机构建设一个行业云,跟现有的私有云进行混合,在提升金融云的监管合规、安全稳定的同时,最大限度地提升经济效益。

  • 为什么要向云架构转型?

首先,降低成本,提高效率。

云本身,不仅仅是个技术问题,还是经济问题。

通过规模化的运营、建设和共享实现规模效益,以获得便宜、廉价的算力。通过软件化、系统化和服务化,提升整个运行效率,间接降低成本。

第二,云转型的核心就是要改变应用架构和原来的技术路线,广泛采取近十年来发展起来的开放开源、分布式的互联网技术路线,提升整个应用研发的敏捷性,促使研发和运行一体化以支撑业务的敏捷和迭代

一旦IT能够低成本,提升敏捷度与迭代,整个业务竞争力会跃上一个新台阶。以前长期的自上向下的建设,变成快速走向市场、并与用户进行业务尝试和迭代,在业务与客户的互动过程中来升级业务系统,其中会不断应用到一些分布式、微服务、云原生的技术。

第三,保持整个IT技术路线的现代化。长期不升级会带来技术架构的老化,运行风险增加和效率低下,以及人才队伍难以保持等问题。只有进行稳定、持续的架构升级,才能保证整个IT的能力。

云架构也是借助于云平台化的效应,来拓展金融机构的业务边界。通过开放银行、开放证券、开放保险,和周围的生态各方建立网络化的连接,拓展自己的业务场景,从线下走向线上。

再者,利用高性价比的、丰富的按需可获的资源,加上数据化处理能力,帮助金融机构在架构转型的过程中,树立起以积累数据资产为目标的客户运营、流量运营的意识,提升企业运用数据智能的能力,提供高精准、更高效的客户服务。

未来的竞争是数据智能的竞争,只有拥有更多的数据资产,建设强大的数据中台,才能实时支撑好数据的智能并且发展业务。

IT架构的发展历程,从最早的大型机、小型机等集中式架构,再到scale-up架构,基础设施、应用架构、研发模式都发生了很大的变化。

随着整个架构的演变,最大的问题是成本高,研发周期过长,一台大机能够支撑上万台的服务器的能力,节能环保。但研发成本周期长、成本高,售价太贵。

同时,传统的应用架构技术比较封闭,生态没有得到发展,而分布式云原生架构,目的就是更加开放,更加敏捷。

原来在一台大、中型机以及小机里面,操作系统、应用软件、中间件,数据库都在一台大机器里运行,是一种高度集中耦合的架构。

而分布式架构,开始用一堆的服务器来替代大机时,相应地,就从一个操作系统变成很多小的操作系统——如何将这些小的操作系统重新耦合起来,变成一个大的操作系统,就是IaaS云的使命。

  • 全面上云怎样降低IT基础设施的总拥有成本?

上层从一个大的中间件,演变成一个分布式的微服务架构;从原来的SOA,进一步发展到分布式微服务,再发展到现在的服务网格。

集中式架构与云原生架构之间的分布式架构阶段,存在一个问题:

当底层开始从几台大型机器,变成众多的小型机器及服务器以后,上层做应用开发的人员,将要面对下面的分布式的计算架构。

因为下面的平台封装得不太好,能力不太强,所以使得上层原来只关注业务和逻辑的开发人员,开始更多关注下面的基础架构。

虽然技术架构的建设更加标准化、开放化,但是应用开发更加复杂,应用人员要关心的事也越来越多。

进一步的云原生架构转型,实际上是经过循环迭代以后,回归到更高层次的平台化、服务化水平。将分布式架构的复杂性封装在整个云平台,其中包括IaaS、PaaS、DaaS等各种技术,让业务和开发重新回归到业务逻辑,而不需要太关注下面的平台。

最上层的业务中台、数据中台、协同平台、AIOT平台,以及支撑其的服务网格、湖仓一体、HTAP、流批一体等技术,都是为了把平台越做越厚,让基于分布式架构的应用开发越来越简单。

底层是从大机、小机、物理机到虚拟机、容器,以及兼具容器和虚拟机的特性的安全容器。

原来的大机通过专有的网络连接大容量的集中存储阵列,到后面小机通过SAN网络连接SAN存储的计算存储分离架构,发展到现在:没有硬盘的神龙服务器,通过标准的以太网连接后面分布式的云盘,形成新一代的计算存储的分离架构,从原来的两地三中心发展到现在的两地四中心、多地多中心的新的容灾体系架构,对原有的体系架构进行全面升级。

在这个过程中,金融云的底层的平台完全交给云服务商进行建设,使得金融机构的人员将专注力放在业务和应用的创新上。对金融机构而言,它有资本充足率的限制,宝贵的核心资本,实际上是要用于金融业务的发展更加高效。

银行的核心竞争力实际上并不在IT基础设施,而是在应用研发和业务的创新方面,帮助中小金融机构整个IT基础设施交由专门的金融行业云承载,实现按需、敏捷、弹性获得算力以支撑应用创新,是我们发展金融行业云的目标。

  • 上行业云过程中,需要考虑的问题

从规模化建设和运营角度来看,我们持续在做规模化的运营,用液冷将机房的PUE下降到一点零几的PUE,通过每年几十万台服务器这种规模化的采购以降低其成本,甚至采购零配件自己组装服务器,云服务价格每年持续的下降,可以给客户带来综合的TCO(总拥有成本)的下降。

在对比TCO成本的时候需要考虑几个因素:

第一,必须要全面上云。如果长期维持着双模IT,而且是以过去老旧传统架构为主的双模IT,客户长期维持两套技术架构和运维体系,是很难节省成本的。

在全面上云的过程中,将原来的传统的硬件F5、负载均衡、防火墙、DNS,加密机等专有硬件设备,都用部署在标准服务器上软件集群来替代,通过NFV替代各种硬件网络设备,以实现全面降本,效益将更加明显。

在上云过程中还解决了软件正版化的问题,不能用原来没有采购跑量的授权软件来与现在的云授权软件做比较:同时IDC建设往往有很大的空闲面积和空闲资源的闲置成本。再将建设机房所用的变电站和维保核算进来,成本是很高的。

上云以后,降低成本的核心是on demand的能力。

On demand就是按需获得资源,获得资源后随时可以释放,所以上云以后一定是要把应用部署进行扩展,能够弹性、敏捷得以进行。

其目的就是需要计算时,将整个基础资源容器化全部拉起,计算完成以后,所有的资源释放,不再继续收费。现在的Serverless、函数计算都是这样的目标,只有达到这个程度以后,才能最大限度的节省成本。

上云以后,底层的IT基础设施这部分的容灾、运维、高可用、切换都交给了服务商,实际上变相降低了人员成本。

未来数据中心、IT技术设施的建设和运营,包括在软硬件上的投入和在人员上的投入,将会呈现出不同的比例。

未来当IT人员能够占到像国外的金融机构的15%的比例,甚至占到金融科技公司40~50%比例时,人员成本会大幅高于软硬件的成本。

我们进行云架构的转型,核心目的就是节省人力成本。

在金融云上,会构建出保险所需要的一些能力。我们会与中科软软通动力、易宝、文思海辉等各种ISV合作,将他们的应用软件和云上的IT基础设施IaaS、PaaS提前对接,客户在迁云过程中不需要自己全客支付改造成本,进行应用的兼容和适配。

同时与一些中保车服等行业云的客户,一块为中小保险提供服务。

保险业是一个监管比较开明的行业,将IT架构搬到云上,实际上会带来很大的收益。

  • 中小证券基金&金融云

由于证券业务的特殊性,券商对4个小时内高可用的要求很高,甚至超过银行,所以对可能存在的交易敏感性,和出现故障的损失性,在合规符合性、系统安全可靠性没有得到实际长期验证之前,监管还是不放心进行集约化的、公有云式的管理。

对此,我们与上交所在三年前已经构建了一个合建的证券行业云,联合建设、联合运营,共同进行对外销售和售后服务。

通过对这个行业云的建设,帮助中小型证券和基金,将其整个系统托管到离上交所交易所最近的机房,在本地建立一个同城多中心的容灾架构,上面提供各式各样的服务,中小金融机构和中小证券基金行业就不用再建设自己的机房了。

金融云XaaS的产品服务能力

金融云上整个的产品架构,基本上跟公有云上所有产品都是一样的。

最底层是内部的数据中心的机房能力,再上层是IaaS能力,然后是DBaaS数据库服务化的能力,还有包括 Paas层的各种能力。

  • mPaas移动开发平台何以“最受欢迎”?

在金融云上,除了Paas能力,我们还会提供一些特色的业务。

比如阿里最具特色、最受客户欢迎的移动平台——mPaas,很多机构使用这个平台构建自己的手机APP系统,打造一个超级APP移动开发平台,它甚至是一个开发、运行、测试、运营一体化的平台。

它脱胎于支付宝强大的 APP底层能力,不仅提供安全稳定的开发管理,还将其变成一个客户运营和流量运营的平台。

这个平台支持native的移动开发,提供一个小程序框架。客户可以把支付宝等平台上的所有小程序迁移过来,也可以利用小程序框架发展自己的小程序生态,让周边的生态合作伙伴不用开发非标小程序,直接将既有其他平台上的小程序迁移过来。

  • 不同成熟度应用的全面迁云

我们对金融行业也是支持不同成熟度的应用,都能够全面的迁云。

现在的很多传统应用还是处于传统、标准和成熟的虚拟化的应用阶段。我们希望这些应用能够向云上进行迁移。

云上迁移并不是要做很多很复杂的改造,例如应用的自维护、自描述,是否进行分布式改造、服务网格改造,我们希望在虚拟化的标准化和成熟度状态,做少量的适配、修改,就能够迁移到云上,不同成熟度的应用迁到云上,可以获得不同云上的红利和特性。

云的原生化改造越强,就能更好的获得云原生的特性。云原生实际上就是云的核心的按需自助,敏捷、弹性等方面的能力。

我们会在上云过程中对所有客户的应用、可用性、连续性、容量性能都做一些分类和标准,根据它不同的要求,制定其上云的标准的部署模板,然后分批进行迁云。

近期,雷锋网《AI金融评论》与阿里云联合主办“银行系统云化升级”实战体验营,关注公众号“AI金融评论”(ID:aijinrongpinglun),回复关键词“参会”,立即进群观看直播。