开源社区中的人工智能(AI)项目正以前所未有的速度增长,既令人兴奋,也充满挑战。斯坦福大学发布的《2025 年 AI 指数报告》显示,过去一年中在 GitHub 上创建的开源 AI 项目数量达到惊人的 430 万个,短短 12 个月内激增 40%。对于研究人员而言,这一发展势头意义重大,但也带来了一项根本性挑战:如何在开放协作的同时,不失去对推动科研发现的数据与知识产权的掌控。 

在研究场景中,关键不仅在于谁拥有硬件,更在于能否对自己的环境拥有管理控制权。研究人员和科学家的成败完全系于数据,我们必须确保在共享环境中,自身独有的研究数据得到保护。唯有能够独立掌控并保护项目的数字足迹,才能实现真正的协作研究环境。值得庆幸的是,研究界已经出现了一种解决方案,即通过项目级控制和更智能的数据引力管理方式,弥合这一鸿沟。

在任职于红帽期间,我有幸参与了美国国家 AI 研究资源(NAIRR)计划。NAIRR 由美国国家科学基金会(NSF)主导设立,旨在推动美国研究资源的升级,以应对 AI 发展所带来的挑战,并帮助实现高端 AI 计算与数据资源的普及,让以往仅由大型科技公司独享的资源得以开放共享。NAIRR 正逐步发展为一项长期研究资源,致力于构建可扩展的国家级基础架构,为不同背景的研究人员和教育工作者提供支持。该项目不仅是美国研究领域的里程碑,也为其他项目如何在共享环境中保持独立性与透明度提供了可复现的范例。

研究隔离的架构设计

NAIRR 如同一个“共享资源池”,作为大规模高效基础架构的标杆模式,使研究人员无需构建数千个单独的资源副本。  自启动项目试点以来,已有来自美国本土及属地的 670 多个项目和参与者加入,其规模可见一斑。  然而,要让“资源池”真正高效运转,每位参与者仍需拥有契合其特定研究需求的专属空间,才能取得卓越成果。NAIRR 正是采用这种方法,助力创新者依托开源基础开展研发工作,同时保留自主掌控权。为协助研究人员在红帽与 IBM、AI 联盟和马萨诸塞开放云联合开展的深度合作试点项目中维护这些项目级边界,红帽提供了一个软件层来编排底层硬件。这使得研究人员能够获得所需的工具与能力,以便在多租户集群中对其命名空间保持自主控制,同时资源提供商仍可高效管理环境。NAIRR 的研究人员可以使用我们的企业级 AI 基础架构,包括红帽 OpenShift红帽 OpenShift AI红帽企业 Linux红帽 Kubernetes 高级集群管理

通过为 AI 和机器学习实验的整个生命周期提供这一统一技术栈,我们助力打造一个协作式生态系统,在保障项目控制权的前提下激发创新发展。例如,借助红帽 OpenShift,研究人员可以为每个项目分配专属 Kubernetes 命名空间和第 2 层 VLAN。他们还可以使用基于资源的访问权限控制(RBAC),在自有项目内部或跨项目协作中创建具有不同级别资源和数据访问权限的组。这种技术配置可确保即使在共享数据中心内,每个项目仍拥有独立的运行环境,保护其网络流量和数据免受未经授权的访问。这一基础有助于研究人员在整个技术之旅中保持独立性,实现从初步探索到成果验证的顺利推进。

平衡共享规模与独占所有权

NAIRR 模式的价值在于其高效性和管理数据引力的能力。通过提供共享的开源基础(即在此基础架构上运行的软件环境),红帽帮助企业组织最大限度地发挥其基础架构支出的效益,并确保其计算能力贴近数据。我们的贡献是更广泛的协作生态系统的一部分,与科学家们用于定制工作的众多其他工具和资源相辅相成。

由于研究工作并非千篇一律,所需的控制程度可能会有所不同。有时,研究人员所需的隔离范围不仅限于软件定义边界,还需延伸至硬件本身。尽管许多研究人员可依托共享平台高效开展研究,但在开展底层操作系统开发或高精度 GPU 测试等专业化测量时,部分研究人员仍需对硬件拥有完全专属权。为此,NAIRR 还提供对隔离裸机的访问。无论研究人员使用 OpenShift 管理的容器还是原始硬件,我们都能提供稳定、安全的运维支持,帮助他们保持工作独立性,同时参与共享社区。

为实验性探索创造空间

这项工作的核心在于提供一个稳定的环境,以探索智能层的未来演进方向。在 AI 模型层出不穷的时代,计算能力是一种稀缺的全球资源,我们必须探索更高效的利用之道。这正是隔离测试平台的价值所在;基于这些平台,我们可以尝试推理路由等新技术,将简单任务智能分配给经济高效的 AI 模型,同时为最复杂的问题保留大规模算力,而且不会干扰核心研究的进行。

例如,NAIRR 支持的项目之一“面向 vLLM 的多模态语义路由”,致力于扩展由红帽发起的 vLLM 语义路由器项目。这项工作侧重于语音文本管道和视觉功能,探索如何在开源环境中维护透明且可审计的决策逻辑。通过提供这些沙盒,我们助力特定项目突破 AI 研究的界限,同时确保更广泛社区的稳定性。

随着行业向代理式 AI 演进,这种实验能力尤为关键。在此趋势下,AI 模型不再局限于基础内容生成,还能够执行复杂的自主化任务。要让这一趋势从行业热潮迈向真正的科学突破,研究人员需要的不仅是原始算力,更需要一条提供专业级生命周期管理与标准化的创新通道。正如需要对人员访问设置控制与护栏一样,研究人员也需要对在其项目中访问数据和计算的代理进行同等程度的监督。

随着 NAIRR 生态系统日趋成熟,其正构建起这样的理想环境。红帽通过提供运维支持(由红帽企业 Linux、红帽 OpenShift 和红帽 OpenShift AI 构成的集成堆栈)来促进实现这一目标,使 PyTorch 等优化工具与 SLURM 等工作负载管理工具能够协同运作,形成统一的高性能基础平台。这使得研究人员能够以重大科研项目所需的企业级严谨标准,构建、训练和部署自主代理。

我们与 NAIRR 的合作证明,开放创新是构建运维稳定且灵活适变的 AI 的最佳方式,共享资源与独立控制并不矛盾。红帽通过提供支持项目级边界管控的开源工具基础,充分论证:AI 的未来既能实现协作共赢,亦可保持独立自主。


关于作者

Heidi Picher Dempsey is the Research Director, Northeast US for Red Hat. She works to seek out and grow research and open source projects with academic and commercial partners in areas such as operating systems, hybrid clouds, performance optimization, networking, security, AI and operations. As a network engineer and operations leader, she designed, built, integrated and operated many different nationwide suites of prototype cloud infrastructure for academic, government and industry use, including the National Science Foundation's GENI project clouds. As part of the CTO Research program, she encourages diverse participation in computer science and engineering research, and promotes collaborations with Red Hat researchers.

UI_Icon-Red_Hat-Close-A-Black-RGB

按频道浏览

automation icon

自动化

有关技术、团队和环境 IT 自动化的最新信息

AI icon

人工智能

平台更新使客户可以在任何地方运行人工智能工作负载

open hybrid cloud icon

开放混合云

了解我们如何利用混合云构建更灵活的未来

security icon

安全防护

有关我们如何跨环境和技术减少风险的最新信息

edge icon

边缘计算

简化边缘运维的平台更新

Infrastructure icon

基础架构

全球领先企业 Linux 平台的最新动态

application development icon

应用领域

我们针对最严峻的应用挑战的解决方案

Virtualization icon

虚拟化

适用于您的本地或跨云工作负载的企业虚拟化的未来