AI 时代的平台工程现状
I.概述
随着选择日益增多以及流程简化和效率提升需求不断增长,软件开发变得越来越复杂,平台工程应运而生。在早期阶段,平台工程专注于构建可靠的基础架构并自动执行重复性任务,从而降低开发团队的手动操作负担。这些举措旨在提升运维效率,确保整个团队能更专注于交付解决方案,而无需耗费大量精力管理基础架构。
然而,平台工程自诞生起便与 DevOps 共同演进,塑造了现代软件开发的格局。平台工程专注于构建和维护能够简化开发与部署流程的平台,其职责包括创建内部开发者平台(IDP)、提升开发人员体验(DevEx)以及确保安全与合规性。随着 DevOps 实践的兴起,进一步推动了这一演进趋势,它强调协作与自动化,催生出一种集成度更高的方法。平台工程与 DevOps 皆有助于增强可扩展性、效率、弹性、灵活性和安全防护,尤其是在技术选择范围不断扩大的云原生和多云环境中。
随着技术生态格局持续演进,人工智能(AI)将成为推动平台工程乃至整个技术领域发展的关键驱动力。依托基于大型数据集训练的深度学习模型,常见用例包括软件代码辅助、客户个性化、科学研究等。毫不意外,大大小小的企业组织都在投入大量资源和预算,为新的和现有的应用注入这些功能,以提高生产力或推动收入增长并构建差异化优势。这将对平台工程团队产生广泛影响:许多企业组织已经改变了工具、流程和总体战略规划,以便开发人员、数据科学家和其他团队能够把握这一划时代的技术范式变革。
本报告全面解读了由 Illuminas 开展的“AI 时代的平台工程现状”调查,重点剖析了平台工程的优势、挑战和未来发展趋势。文中深入探讨了企业组织如何采用和实施平台工程实践、所跟踪的关键绩效指标(KPI)以及取得的成效。此外,本文还概述了云原生技术、自动化工具和 AI 解决方案的集成,以及它们与平台工程原则的一致性。
II.关键目标
平台工程师(如平台团队)或支持此功能的人员,在塑造企业组织内部软件开发未来方面发挥着重要作用。本报告旨在提供一个有丰富数据为支撑的视角,深入剖析该领域的发展前景。
本报告通过研究行业从业者的趋势、挑战及最佳实践,呈现相关数据以辅助选择平台工程策略,同时着重指出潜在挑战。
该报告聚焦以下关键目标:
- 评估平台工程的认知度和采用情况:本研究通过评估不同企业组织对平台工程的理解程度和实施情况,旨在清晰呈现当前采用水平,并揭示推动其发展的关键因素。
- 了解影响开发人员效能与效率提升的首要考虑事项:本研究探讨了公司在提高开发人员生产力和简化工作流方面的关键优先事项,并研究了该领域的策略和投资。
III.受访者统计数据
为了撰写本报告,红帽赞助了一项针对美国(US)、英国(UK)和亚太地区英语区(APAC) 1,000 名平台工程师和 IT 决策者(ITDM)的调查,以深入洞察平台工程的演变趋势,并更好地了解其整体采用情况和企业组织层面的认知。数据是通过对受访者进行 20 分钟的在线调查形式收集的,这些受访者来自第三方数据库。开展调查的时间为 2024 年 9 月和 10 月。
为了全面展现平台工程格局,本研究收集了不同群体的见解,其中 IT 决策者与平台工程师各占半数。借助这种均衡配置,我们既能捕捉平台工程计划领导者的视角,也能了解直接参与实施与日常运维的人员的观点。
本研究涵盖各种规模的企业,其中 35% 属于中型企业,65% 属于大型企业。企业组织规模多样化,可确保研究结果反映出不同规模企业组织的经验与挑战,包括拥有精简开发团队的企业组织和开发体系庞大且复杂的企业组织。
为了进一步丰富数据,本调查还覆盖了多个行业领域的代表性群体,包括来自软件开发、金融、零售、医疗卫生及专业服务等领域的专业人士。这种跨行业代表性,可确保本报告中提供的见解和趋势具有广泛适用性,对正经历数字化转型和致力于优化软件开发流程的各类企业组织都具有现实意义。
IV.十大重要发现
该调查揭示了平台工程成熟度与企业组织成功之间的关联性,强调了组建专业团队以及在基础架构和安全防护等领域进行战略投资的重要性。本报告还探讨了生成式 AI 在平台工程领域日益重要的作用,以及它改变软件开发实践的潜力。此外,文中还探讨了企业组织在采用平台工程方面的常见挑战,如工作流集成、安全风险和技能差距。通过分析这些调查结果,本报告旨在为企业组织提供宝贵见解,帮助他们应对不断变化的平台工程格局,并优化其软件开发生命周期。
主要调查结果包括:
- 41% 的拥有成熟平台工程实践的企业组织在开发人员生产力工具(61%)等领域投入更多资金,并跟踪更多关键绩效指标(KPI)(平均 7 项),最终取得了更大的成功(41% 的企业组织报告成功率显著提升)。
- 采用平台工程的原因包括增强安全防护(48%)和改善协作(44%)。
- 随着企业组织成熟度不断提升,对平台工程的投资也持续增加,52% 的企业组织从基础架构现代化着手,59% 的企业组织始终优先考虑安全防护。
- 常见挑战包括工作流集成(37%)、安全风险(37%)、技能差距(34%)和预算限制(33%),即使对于面临工具不兼容(28%)和平台不稳定(26%)问题的高级阶段企业组织而言亦是如此。
- 安全问题(48%)、协作需求(44%)和解决运维瓶颈(39%)是采用平台工程的关键驱动因素。
- 处于高级阶段的企业组织跟踪更多成功指标(平均 7 项),重点关注生产力(45%)、安全防护(41%)和性能(40%),而处于早期阶段的企业组织则优先考虑成本(35%)。
- 平台工程的早期成效显著,其中 22% 的企业组织表示极为成功,72% 的企业组织表示相当/非常成功,这推动了进一步的投资和更深入的参与。
- 62% 的企业组织拥有专门的平台工程团队,这充分体现了对该方法的高度重视。
- 生成式 AI 被认为对平台工程具有战略重要性,45% 的企业组织将其视为战略的核心组成部分。
- 生成式 AI 被广泛用于各种用途(76%),包括文档(76%)、代码生成(74%)和智能代码建议(59%),正在重塑软件开发流程。
发现 1:平台工程成熟度的影响
经验和成熟度确实至关重要。与处于早期阶段的企业组织相比,拥有更成熟平台工程实践的企业组织中有 41% 的企业组织投入更多资源、跟踪更多关键绩效指标(KPI),并取得了更大的成功。(第 11 页)
“平台工程成熟度指数是为本次调查开发的一种模型,用于评估企业组织平台工程实践的成熟度。该模型基于对一系列调查问题的回答分析结果构建,旨在解读企业组织在采用和实施平台工程方面的进展情况。
该指数将企业组织划分为四个不同的成熟度级别:探索、新兴、成熟和高级。每个级别代表了平台工程之旅中的不同阶段,包括初期探索以及高级集成和优化。该模型有助于您系统性地了解平台工程成熟度的不同阶段,并识别与每个阶段相关的关键趋势、挑战和机遇。”1
与刚开始平台工程之旅的企业组织相比,更加成熟的企业组织在生产力方面有所提升,其中 54% 的处于高级阶段的企业组织还实现了创新能力增长。(第 19 页)
企业组织最终取得的成效各有差异,这凸显出持续推进平台工程建设的重要性,表明仅构建基础远远不够,只有持续优化才能带来更出色的成效,并实现软件开发生命周期的更高效转型。
发现 2:安全防护与协作是成功的基石
安全防护与协作是平台工程计划取得成功的基石。越来越多的企业组织开始关注平台工程,因为它能够增强安全防护(48%)并促进开发团队内部的协作(44%)。(第 16 页)
通过提供一个以安全为中心的标准化开发平台,企业组织能够在降低风险的同时,赋能开发人员协同工作。关注安全防护与协作,不仅提升了开发流程的效率,还确保了最终产品的合规性。
尤其是处于高级阶段的企业组织,他们在提高开发人员生产力(52%)和增强安全防护与合规性(46%)方面取得了更出色的成效。(第 19 页)
发现 3:投资重点——从自动化到合规
虽然基础架构现代化对于处于初始阶段的企业组织(55%)而言是首要任务(第 13 页),但随着企业组织的发展,投资范围将不断扩大,尤其集中于高级自动化领域(85%)。(第 13 页)
紧随其后的是安全防护与合规性(59%)(第 14 页)以及开发人员生产力工具(55%)(第 14 页)领域的投资。这展现出更全面的平台工程方法,可提升效率、增强安全防护并推动创新。
发现 4:平台工程采用中的隐性障碍
通往平台工程成功的道路并非一帆风顺。将平台工程集成到现有工作流中以及确保强大的安全防护,它们是企业组织最常提及的两大障碍(占比均为 37%)(第 15 页)。技能差距和预算限制(尤其对处于采用初期阶段的企业组织而言)占比达 40%(第 15 页)。然而,这些挑战并不会随着企业不断积累经验而消失。在处于高级阶段的企业组织中,有三分之一(约 30%)(第 15 页)的企业组织常面临工具不兼容、平台不稳定和持续缺乏相关知识的困扰。
这凸显了持续投资于培训和支持以及精选已知能高效协同的集成化工具的重要性。
发现 5:平台工程助力卓越运维
企业组织对平台工程感兴趣的原因多种多样。随着企业试图打破孤立的环境并促进更高效的团队合作(44%),他们对改善协作和简化工作流的需求变得愈发强烈,这对采用平台工程产生了重大影响(第 16 页)。有趣的是,39% 的处于早期阶段的企业组织也主要受到运维瓶颈的影响而选择采用平台工程方法,有 36% 受到扩展困难的影响,还有 31% 受到知识孤岛的影响。(第 16、17 页)
各种原因综合在一起,持续强化了构建统一平台的需求,该平台需支持所有项目成员实现卓越运维和更高的效率。
发现 6:平台工程的成功涉及多个方面
采用高级平台工程实践的企业组织通常会跟踪更广泛的指标,平均约 7 项关键绩效指标(KPI)。这些企业组织重点关注反映以下方面的指标:生产力提升(45%)、增强安全防护(41%)、改进应用性能(40%)以及提高开发人员和客户满意度(40%)。处于平台工程早期阶段的企业组织中,有 35% 倾向于优先考虑与成本相关的指标。(第19页)
这种关注点的差异凸显出:随着企业组织成熟度提升,平台工程领域的成功概念也在持续演进,企业组织开始认识到平台工程的价值远不止于削减成本,而是能带来更广泛的综合效益。
发现 7:早期成功促进更深层次的参与
平台工程日益普及,源于许多企业组织迅速看到了它的成效,即便是在平台工程之旅的初期阶段,也有 22% 的企业组织非常成功地实现了落地应用。超过三分之二(72%)的企业组织表示平台工程落地实施非常成功。
这种早期成功体验会形成良性的反馈循环,激励团队不断优化策略、完善平台,最终从内部推动最佳实践的规模化应用和知识共享。(第 20 页)
发现 8:专门的平台工程团队
超过一半的企业组织(62%)(第 25 页)拥有完全专注于平台工程的专职团队,这表明他们对这种方法的高度重视。
这种方法表明开发组织内部正朝着更加专业化的方向转变,在现有应用平台和 DevOps 团队的基础上深化建设。这些专门的平台团队专注于创建和完善内部开发人员平台(IDP),与开发团队一同简化工作流,并打造更高效、更具协作性的开发环境,从而推动卓越运维。
发现 9:生成式 AI 具有重要的战略意义
34% 的企业组织将生成式 AI(gen AI)视为其平台工程战略的重要组成部分,近一半(45%)的企业组织将它视为核心要素。
这凸显出业界日益认识到:AI 能力对于推动创新、提升效率和释放平台工程的全部潜力至关重要。它不仅与开发人员工具和自动化方法相关,还与为 AI 融合应用置备和保障运行时相关。(第 42 页)
发现 10:通过多样化的生成式 AI 用例为开发人员赋能
生成式 AI 在平台工程中的应用涵盖多种用例,包括 AI 生成文档(76%)、自动代码生成(74%)和智能代码建议(59%)等。(第 43、47 页)
这种广泛采用凸显了生成式 AI 的多功能性,以及它在简化软件开发生命周期各个方面的能力。通过将生成式 AI 集成到工作流中,企业组织能够提高开发人员的工作效率、提升代码质量,并培育更具创新性的开发文化。
V.了解更多
平台工程相关资源链接
概述:“什么是平台工程?”
概述:“面向平台工程师的红帽 OpenShift”
视频:“平台工程”
博客:“什么是平台工程?为什么我们需要它?”
电子书:《开发人员门户网站:利用红帽开发人员中心做好准备,迎接卓越》
开始使用红帽开发人员中心:https://developers.redhat.com/rhdh/overview
VI.红帽如何助力您的平台工程之旅
推动平台工程成功落地
红帽提供强大的工具和资源生态系统,旨在支持企业组织的平台工程之旅,助您实现预期目标:
- 借助基于 Kubernetes 的强大应用平台红帽® OpenShift®,为您的平台工程计划奠定坚实基础,确保一致性、可扩展性和可靠性。
- 借助红帽 Ansible® 自动化平台增强自动化功能,通过基础架构即代码(IaC)实践,简化基础架构置备、配置管理和应用部署。
- 借助红帽 OpenShift Pipelines 加速软件交付生命周期,这是一种云原生 CI/CD 解决方案,可与 GitOps 原则无缝集成,以实现高效的自动化应用部署。
- 红帽开发人员中心为开发人员提供工具、资源和支持的自助服务访问权限,借助该平台,可促进协作和知识共享。
- 通过红帽可信应用管道交付安全至上且合规的应用,该解决方案在整个软件开发生命周期中整合了安全防护最佳实践和合规检查。
- 借助红帽 OpenShift Dev Spaces 为开发人员赋能,为他们提供预配置的工作空间,并支持按需访问所需的工具和资源,从而实现高效且富有成效的开发。
通过采用红帽全面的解决方案套件,您的企业组织能够从容应对平台工程的复杂性,加速软件开发生命周期,并推动创新进程。
红帽报告,由 Illuminas 开展的调查。“AI 时代的平台工程现状”,2024 年 10 月。