ITIL4发布到现在也就5年多时间,按照以往的更新节奏,ITIL5最早也得2027年之后。但现在IT发展的速度,跟以前完全不是一个量级。AI都快把我们的饭碗抢了(开个玩笑),ITIL要是还按部就班,估计真要被时代抛弃了。
最近行业里确实有不少关于ITIL5的讨论,虽然官方还没有任何消息,但从目前IT服务管理面临的挑战来看,下一代框架的轮廓已经若隐若现了。
当前ITIL4的局限性越来越明显
怎么说呢,ITIL4在2019年发布时确实很先进,引入了价值流、服务价值系统这些概念。但这几年下来,很多企业在落地时都遇到了新问题。
我们公司去年引入AIOps平台后,传统的事件管理流程基本形同虚设。以前一个告警要折腾半天才能定位问题,现在AI直接给你分析出根因,还能预测潜在风险。70%的运维工作都自动化了,但新问题也来了:AI给的建议到底听不听?出了问题算谁的?这些ITIL4里可没说清楚。
还有个更现实的问题。现在业务部门自己用低代码平台开发应用,根本不走IT部门的变更流程。一个金融行业的朋友跟我抱怨,他们公司业务部门自己搞的小应用有200多个,IT部门"管都管不住"。ITIL4的变更使能(Change Enablement)在这种场景下,基本就是个摆设。
AI原生将成为核心设计理念
基于这两年的实践,我觉得ITIL5肯定会把AI作为核心要素来设计,而不是像现在这样只是个补充。
比如说,事件管理可能不再是"人工分级-派单-处理"这个流程了,而是"AI预测-自动修复-人工验证"。我们公司现在就在试点这个模式,大概有60%的常见故障都能自动处理。运维同事终于可以不用半夜爬起来处理磁盘空间告警了。
但这里有个坑。上个月我们的AI系统误判了一个情况,自动重启了一个核心服务,结果影响了200多个用户。虽然只持续了3分钟,但业务部门还是炸了锅。所以说,AI再厉害,人的判断和兜底机制还是不能少。ITIL5估计会花很大篇幅来讲人机协作的边界和原则。
问题管理也会发生根本性变化。现在我们用机器学习分析历史数据,能提前发现80%的潜在问题。传统的"事后分析"模式正在向"事前预防"转变。这个转变说起来简单,但对组织能力的要求完全不一样。你得有数据分析能力,得懂算法,还得能说服业务部门相信你的预测。
业务和IT的边界将彻底消失
"现在哪还分什么业务和IT啊,业务就是IT,IT就是业务。"这是一个零售行业CIO的原话,我觉得特别有道理。
ITIL5可能会彻底打破IT服务管理的边界。不是说IT部门为业务部门提供服务,而是大家一起创造价值。我们公司最近在推行"业务运维一体化",每个产品线都有运维人员embedded进去。他们不仅要保障系统稳定,还要参与产品设计,提供技术视角的建议。
效果还不错,至少产品上线后的问题少了一半。但说实话,这对IT人员的要求太高了。你不仅要懂技术,还要懂业务,甚至要懂一点产品设计。培养这样的人才,没个三五年下不来。
生态协同将取代供应商管理
现在企业用的系统,十有八九都不是自己从头开发的。我们公司光是第三方服务就有40多个,SaaS、PaaS、各种API,怎么管?ITIL4的多供应商管理(SIAM)理论上挺完美,实际操作起来累死人。
每个供应商都有自己的SLA,出了问题互相推诿。上个季度我们有个核心系统宕机,涉及3个供应商,光是定位问题归属就花了2个小时。等问题解决,半天过去了。
ITIL5估计会更强调生态协同。不是你管理供应商,而是大家形成一个生态,共同为客户创造价值。这个月我们刚跟几个核心供应商建立了联合运维机制,建了个共享的监控平台,出问题大家一起上,不分彼此。当然,这需要很强的信任基础,商务条款也要重新设计。
敏捷和DevOps将成为默认模式
ITIL4虽然提到了敏捷和DevOps,但还是把它们当作"可选项"。但现在你看,哪个互联网公司不是DevOps?哪个产品团队不跑敏捷?
ITIL5大概率会把敏捷和DevOps作为默认模式。变更管理不再是层层审批,而是自动化管道加风险控制。我们现在的做法是,低风险变更走自动化管道,5分钟内完成部署;高风险变更才走传统流程。这样下来,85%的变更都能当天完成。
但这里面的挑战在于,怎么定义"低风险"?我们花了3个月时间,分析了2000多个历史变更,才建立起一个相对靠谱的风险评估模型。而且这个模型还在不断调整,因为业务在变,技术在变,风险特征也在变。
写在最后
说到底,ITIL只是个工具,关键还是看怎么用。我见过太多企业,花大价钱实施ITIL,最后流程是有了,效率反而降低了。为啥?因为光有流程没用,人的思维不转变,文化不改变,再好的框架也是摆设。
ITIL5什么时候来,会是什么样,说实话谁也说不准。但有一点可以肯定:未来的IT服务管理一定会更加智能、更加敏捷、更加以人为本。与其等ITIL5,不如现在就开始探索和实践。