德国铁路是全世界第三大的铁路网,每天班次高达3万7千多班。因为采联营集团发展模式,以五大不同运输业务的公司为主,旗下更有近两百家子公司。另外还成立了一个DB Systel公司,负责所有全集团数位转型和IT战略,等于是德国铁路集团旗下的IT团队。
他们这几年决定以永续行动力(Sustainable Mobility)作为集团愿景,不论是长短程运输,或是物流,都开始推动绿色数位转型,目标就是要做到绿色IT(Green IT),来降低对环境的影响。
德铁绿色数位转型的第一步就是要找出方法,来量测出工作负载的碳排放影响。DB Systel平台策略和赋能首席技术顾问Gualter Barbas Baptista点出关键理由:「没有好的数据提供资讯,就没办法思考替代方案。」就像火车误点了,如果没有提供延误资讯,乘客就无从决定如何应对,要不要等待,还是赶快换一班车。「这正是为何必须建立资讯能见度。」他强调。
本来他们想用公云供应商提供的碳排仪表板工具,来获取这类资讯,但是,公云提供的资讯,无法分辨单一AP的碳排放量,资料颗粒度也太粗,只能概略知道碳排分布百分比,而没有更精确的数值,资讯即时性也不足,有些工具甚至要等到数据产生后3个月,才能提供。
后来,德铁改用了一款开源的K8s能耗监控工具Kepler,来搜集自家云端架构的能源使用率,再转换成CO2碳排放资讯,打造出了给高层和开发人员都能用的绿色IT仪表板,连一个容器的碳排都能几乎即时性的提供,每3秒就能更新一次,德铁还嫌太频繁,放宽到20秒一次。
这个碳排监控工具,让德铁开发人员和架构人员,真正可以用来衡量自己写的程式码,或所选择的架构的碳排数据。
在今年K8s Summit大会上,我们特别找来Kepler专案维护成员IBM东京研究院的研究科学家Marcelo Carneiro do Amaral,对台湾企业介绍这一款国外云原生生态圈越来越重视的新工具。
Marcelo指出,目前要落实云原生IT永续最大的挑战是,缺乏统一的指标来监控云原生环境的IT能耗与碳排放。各家业者有自己的指标和不同的碳足迹计算标准,甚至企业自家机房也采用不一样的碳排计算标准,很难做到一致性的追踪管理。
尤其是生成式AI的应用,如何得知你所打造的LLM应用,带来多少能源消耗?甚至是哪一次的查询,哪一次下的提示工程指令产生多少碳排,Kepler的追踪颗粒度可以短到每秒一次,小到每一只Process,也可以按容器、Pod丛集,来提供不同层级的能耗资讯透明度,弹性非常大,开始有云端维运监控服务业者,将Kepler整合到自家云原生监控仪表板了。有企业为了因应欧洲法遵,要求IBM提供LLM模型的能耗报告,也是靠这款工具来取得训练和推理阶段的能耗数据。
生成式AI是台湾大型企业现在最想要导入的新兴技术,但要如何兼顾企业长期永续发展的目标,Kepler看起来是目前的首选,这也是我们这一期的封面故事「云原生永续数据怎么量」的报导主题。