国泰金控
「3年预算,没想到2年就用完了!」国泰金控资讯长吴建兴指出。他回顾过去3年多的上云旅程,关键转折点是走出练兵阶段,转为开始扩大规模正式上云的转换过程。
金管会在2019年第一次放宽金融上公云的规范之后,许多金融业者跃跃欲试,国泰金控也是其中之一,先从银行开始发展上公有云。国泰当时就开始思考未来的上云策略,找来外部顾问学习,评估哪些前导系统适合优先上云,同时发展云端架构。
四阶段上云规画,先站稳单一公云,再发展多云
国泰世华银行将上云旅程分为4个阶段,2020年启动第一阶段公有云旅程,展开规画和评估。2022年则进入公云采用阶段,先站稳单一公有云,来同步发展多云策略,选定少数前导性资讯系统搬上公云。从2023年起开始进入第3阶段,持续优化并确保云端服务安全及提升效率与效力。最后一个阶段,未来更要朝向多公云策略发展,打造现代化云原生应用,来完成转型。
在2022年时,经过2年练兵的国泰金控,订出了以3~5年全集团100套系统上云的愿景,要从一家子公司转而协助集团各子公司上云,也要从一套系统发展到上百套系统上云的规模。
为了开始准备进入大量云端使用阶段,国泰不只订定了大规模上云策略,还发展出了一套上云的方法论,一方面透过外部顾问团队的协助,参考Gartner 5R和AWS 7 Rs云端迁移模型的定义,进一步依据自己的发展需求,订出了Cathay 6R云端迁移方法论。
在这套方法论中,国泰将系统迁移方式,依据上云模式和开发成本,分为Rehost、Re-platform、Refactor、Rewrite、Replace和Retain共6种迁移架构,并对应到IaaS、PaaS、SaaS三种不同上云模式。
国泰金控数数发中心副总经理陈维铭指出,国泰云端发展过程,以云原生技术架构,来推动多公云混合云架构的发展,搭配这套6R方法论协助评估。尤其在资安控管上,引进了新一代的零信任资安观念,取代过去防护型资安概念。现今已经将这套导入方法论运用到银行、产险子公司,目前正要导入到证券子公司。
以自家上云方法论,打造出云端转型平台
不只是参考作法,国泰甚至将这套方法论打造成了一个「云端转型平台」的系统。想要上云的子公司,自己填妥平台上的上云评估问题,就会自动产生出一份针对该子公司上云专案而客制的上云剧本(Playbook),作为子公司上云的参考引导。陈维铭表示,透过云端转型平台的辅助,大约半年就可以完成一件上云专案。
3年来,国泰世华银行迄今完成了约10多个系统上云,包含关键或非关键系统。不过,「做了才发现,要全部上云,实在还有很长一段距离跟难度。」吴建兴坦言,这十几个系统上云是练功,培养技术能力,现在更会思考为何上云,衡量成本和效益。
在前期练兵阶段,国泰按照人员来分配和控管上云的额度,等到AP真正搬上云后,才观察到在云端执行真正的成本结构。不像传统伺服器就算24小时运作,也是固定成本,系统一但上了公云就像按下码表开始计算费用,使用越多种云端服务,使用越久,费用就越多。
国泰原本与云端业者签约3年,没想到到了去年,才推动上云计划2年就用完了3年的预算。有些系统上云之后,才发现维运的费用比预期更高,甚至有系统一度先下云,重新调整架构后再上云。
国泰世华银行资深副总经理王志峰表示,回顾银行3年上云经验来看,一方面建立了完整的云端治理制度,也将资安纳入了上云架构首要考量,还统一了云端和地端的平台建置和管理工具,将高度自动化的云端环境建置工具,导入到地端环境。过程中更累积了不少系统迁移、不同架构的上云下云操作经验,像是如何运用系统重构或重写,大幅降低后续上云维运的成本,或是将云原生系统下云改为地端架构的转换经验。
国泰也以资安需求作为整体考量,来打造金融云端应用环境,在云端基础架构设施上,先以单一公有云为发展主轴打基础,另一方面持续强化维运,包括建立了集中式监控平台,发展云地监控告警机制,以及多云平台管理模式。相关云端的资安数据也都整合到资安监控中心。今年初,国泰也开始陆续布建SRE相关机制和团队,也积极发展QA测试机制,来因应日后更复杂架构下的服务品质。
云端维运开始注重FinOps成本控管与优化
尤其在云端维运成本的控管上,3年经验让国泰更加重视FinOps(云端维运成本控管),逐步强化自家管理平台的资源管控和节费机制,不只整合维运监控资讯,也整合了云端业者提供的帐务资料,明年计划推出跨云监控整合平台,将监控和成本管理整合到单一平台。
这些资源管控和节费机制例如,视觉化仪表板不只提供维运监控数据,还能同时提供帐务仪表板。国泰还从十多套已经上云系统的维运过程中,搜集了不同类型应用的日常运作费用数据,进行成本合理性分析,来建立正常营运成本的参考标准,一但超过标准值,就会触发告警机制,通知相关技术或业务人员,来了解是异常或是合理的业务爆量所致。另外,也会在长假或过年期间,关闭不需要的公云测试环境来节费。
在新版上云规范公布后,国泰金仍旧继续维持原有的上云策略,但会开始展开多云应用的布局,善用不同公云优势,计划分别用来部署AP、数据分析和办公室OA应用,再加上地端环境,逐渐迈向多云混合云架构。
计划设立委外委员会,负责上云委外审查
国泰过去以瘦核心、强中台的发展策略,也会持续采取云地互为备援的策略。尤其与交易相关的应用,都会采取云地互为备援,不会单靠云来服务。
另外,在这次新版委外办法中,特别要求要有权责单位负责,国泰金控计划以管理委员会的形式来担任权责单位,不只上云,还要负责相关委外作业的审查。这是国泰金控独到的治理作法。
原本国泰IT的委外作业,每一个案件都会送到董事会,但是,不少IT专案涉及太多技术性细节,尤其是资安机制。所以,国泰决定成立委外委员会的形式,来多一道把关机制。
在授权范围中的专案项目,可以在这个委外委员会完成核准,不用再送到董事会。若遇到重要专案委外,例如重大性消费金融业务系统要使用到境外公云,就会先送到委外委员会初审,再送到董事会核准。国泰初步构想是在金控端设立一个云端治理暨委外管理委员会,另外也在每一家子公司,在总经理下设立各子公司的委外委员会。目前正在研拟这个委外委员会的设置办法。
未来,因应多云管理,国泰金特别重视四大类型的挑战,包括了新版规范的法令合规、资讯安全、上云效益和跨界人才。这些挑战会互相影响,必须同时多方考量。像是国泰在一朵公云已发展出了一些监控工具,开始采用另一朵公云时,因为两朵公云的环境和功能差异不小,又得重新开发出符合另一朵云的监控工具。在管理人才上,也需要培养出足够的人力来进行多云的管理。
尤其,每一朵云的资安框架虽然概念相近,但实际运作机制的差异很大,计价标准也不同,甚至不同云所用到的技术特性也很不一样,FinOps发展也必须持续再深化。「必须更了解子公司对云端的需求和使用情形,上云才能真正有效益。」吴建兴强调。