Os projetos de inteligência artificial (IA) na comunidade open source crescem em um ritmo ao mesmo tempo empolgante e desafiador. O 2025 AI Index Report da Stanford University apresentou informações sobre impressionantes 4,3 milhões de projetos de IA open source criados no GitHub no ano passado: um aumento de 40% em apenas 12 meses. Para pesquisadores, esse impulso é vital, mas também apresenta um desafio fundamental: como colaborar no open source sem perder o controle sobre os dados e a propriedade intelectual que impulsionam a descoberta.
Em um contexto de pesquisa, não se trata apenas de quem é o proprietário do hardware; trata-se de ter controle administrativo sobre seu ambiente. Pesquisadores e cientistas dependem dos dados. Por isso, precisamos saber que, em um espaço compartilhado, nossas entradas exclusivas estão protegidas. Essa capacidade de controlar e proteger de maneira independente a área de ocupação digital de um projeto possibilita um ambiente de pesquisa verdadeiramente colaborativo. Felizmente, uma solução surgiu na comunidade de pesquisa: uma maneira de preencher essa lacuna com o controle no nível do projeto e uma forma mais inteligente de gerenciar a gravidade dos dados.
Na minha função na Red Hat, tive a sorte de trabalhar com o programa National AI Research Resource (NAIRR). Liderado pela National Science Foundation (NSF), o NAIRR foi criado para evoluir os recursos de pesquisa dos EUA para enfrentar os desafios do desenvolvimento de IA e ajudar a democratizar o acesso aos recursos de dados e computação de IA de ponta, normalmente disponíveis apenas para as principais empresas de tecnologia. O NAIRR vem se transformando em um recurso de pesquisa de longo prazo e cria uma infraestrutura nacional escalável que oferece suporte a pesquisadores e educadores de todas as formações. Embora esse projeto seja um marco na pesquisa dos EUA, ele também serve como um exemplo reproduzível de como os projetos podem manter a independência e a transparência em um ambiente compartilhado.
Arquitetura do isolamento para pesquisa
O NAIRR atua como um ponto de convergência: um modelo de infraestrutura eficiente em larga escala que elimina a necessidade de pesquisadores criarem milhares de cópias individuais de recursos. Com mais de 670 projetos e participantes dos Estados Unidos e seus territórios envolvidos desde o piloto do projeto, a escala é óbvia. Mas, para que um ponto de convergência seja eficaz, cada participante também precisa de seu próprio espaço adaptado às necessidades específicas de pesquisa para prosperar. O NAIRR usa essa abordagem para ajudar inovadores a ancorar seu trabalho em uma base open source sem abrir mão do controle. Para manter esses limites no nível do projeto para pesquisadores do Deep Partnership Pilot, da parceria entre Red Hat e IBM, a AI Alliance e o Mass Open Cloud, a Red Hat fornece uma camada de software que orquestra o hardware subjacente. Isso oferece aos pesquisadores as ferramentas e os recursos necessários para manter o controle autônomo sobre seu namespace em um cluster multi-tenant, permitindo que o provedor de recursos gerencie o ambiente com eficiência. Os pesquisadores que trabalham no NAIRR têm acesso à nossa infraestrutura de IA de nível empresarial, incluindo o Red Hat OpenShift, o Red Hat OpenShift AI, o Red Hat Enterprise Linux e o Red Hat Advanced Cluster Management for Kubernetes.
Ao fornecer esse stack consistente para todo o ciclo de vida de experimentos de IA e machine learning, oferecemos suporte a um ecossistema colaborativo onde a inovação pode prosperar sem comprometer o controle do projeto. Por exemplo, ao usar o Red Hat OpenShift, pesquisadores podem atribuir a cada projeto seu próprio namespace do Kubernetes e VLAN de camada 2. Eles também podem usar o controle de acesso baseado em recursos (RBAC) e criar grupos com diferentes níveis de acesso a dados e recursos no próprio projeto ou em colaboração com outros. Essa configuração técnica confirma que, mesmo em um datacenter compartilhado, cada projeto tem seu próprio "espaço" isolado, protegendo o tráfego de rede e os dados contra acessos não autorizados. Essa base ajuda pesquisadores a passar da descoberta inicial para resultados validados, mantendo a independência em toda a jornada tecnológica.
Equilíbrio entre escala compartilhada e propriedade exclusiva
O valor da abordagem do NAIRR está em sua eficiência e capacidade de gerenciar a gravidade dos dados. Ao oferecer uma base open source compartilhada — o ambiente de software executado nesta infraestrutura — a Red Hat ajuda as organizações a maximizar os benefícios do investimento em infraestrutura e manter o poder de computação próximo aos dados. Nossas contribuições fazem parte de um ecossistema colaborativo mais amplo, junto a muitas outras ferramentas e recursos que cientistas têm à disposição para personalizar o trabalho.
Como a pesquisa não é uma solução única, o nível de controle exigido pode variar. Às vezes, o isolamento necessário para pesquisadores vai além dos limites definidos pelo software e atinge o próprio hardware. Enquanto muitas pessoas que pesquisam prosperam em plataformas compartilhadas, outras precisam de propriedade exclusiva do hardware para medições especializadas, como o desenvolvimento de sistemas operacionais de baixo nível ou testes de GPU de alta precisão. Para oferecer suporte a isso, o NAIRR também fornece acesso a máquinas bare metal isoladas. Independentemente de os pesquisadores usarem containers gerenciados pelo Red Hat OpenShift ou hardware bruto, fornecemos a base operacional segura e estável que ajuda a manter a independência do trabalho enquanto ainda participam dessa comunidade compartilhada.
Abra espaço para descobertas experimentais
Uma parte essencial desse trabalho é oferecer um ambiente estável no qual também exploremos o futuro da camada de inteligência. Na era de muitos modelos de IA, a capacidade computacional é um recurso global escasso, e precisamos encontrar maneiras de usá-la com mais eficiência. É aí que os ambientes de teste isolados se tornam tão valiosos: eles permitem experimentar novas categorias, como o roteamento de inferência, que direciona de maneira inteligente tarefas simples para modelos de IA econômicos e reserva computação massiva para os problemas mais complexos, sem interromper a pesquisa principal.
Por exemplo, um dos projetos apoiados pelo NAIRR, o Multi-Modal Semantic Routing for vLLM, é dedicado a estender o projeto vLLM Semantic Router fundado pela Red Hat. Esse esforço se concentra em pipelines de fala e texto e recursos de visão, explorando como manter a lógica de tomada de decisões transparente e auditável em um ambiente open source. Ao oferecer esses sandboxes, ajudamos projetos específicos a ultrapassar os limites da pesquisa em IA, garantindo a estabilidade da comunidade em geral.
Essa capacidade de experimentar é vital à medida que o setor migra para agentes de IA, onde os modelos de IA vão além da simples geração para realizar tarefas complexas e autônomas. Para que essa tendência passe de sensacionalismo do setor a inovação científica, pesquisadores precisam de mais do que apenas força bruta: eles precisam de um canal de inovação que ofereça gerenciamento do ciclo de vida e padronização de nível profissional. Assim como exigem controle e proteções para o acesso humano, pesquisadores precisam do mesmo nível de supervisão para agentes que acessam dados e computação em seus projetos.
À medida que o ecossistema NAIRR amadurece, ele fornece exatamente esse ambiente. A Red Hat facilita isso ao fornecer o elemento operacional (o stack integrado do Red Hat Enterprise Linux, Red Hat OpenShift e Red Hat OpenShift AI) que permite que um conjunto de ferramentas de pesquisa avançadas, como o PyTorch para otimização e o SLURM para gerenciamento de cargas de trabalho, funcione como uma base unificada de alto desempenho. Isso permite que pesquisadores criem, treinem e implantem agentes autônomos com o mesmo nível de rigor empresarial que a ciência de alto risco exige.
O trabalho que realizamos com o NAIRR prova que inovar em open source é a melhor maneira de criar uma IA flexível e operacionalmente estável, e que recursos compartilhados e controle individual não são conflitantes. Ao oferecer uma base de ferramentas open source que oferece suporte aos limites do projeto, a Red Hat ajuda a demonstrar que o futuro da IA pode ser colaborativo e independente.
Sobre o autor
Heidi Picher Dempsey is the Research Director, Northeast US for Red Hat. She works to seek out and grow research and open source projects with academic and commercial partners in areas such as operating systems, hybrid clouds, performance optimization, networking, security, AI and operations. As a network engineer and operations leader, she designed, built, integrated and operated many different nationwide suites of prototype cloud infrastructure for academic, government and industry use, including the National Science Foundation's GENI project clouds. As part of the CTO Research program, she encourages diverse participation in computer science and engineering research, and promotes collaborations with Red Hat researchers.
Mais como este
O paradoxo agêntico e o argumento a favor da IA híbrida
Agentes de IA exigem um novo stack de infraestrutura: AMD e Red Hat entregam
Operating System Management | Compiler
Technically Speaking | Inside open source AI strategy
Navegue por canal
Automação
Últimas novidades em automação de TI para empresas de tecnologia, equipes e ambientes
Inteligência artificial
Descubra as atualizações nas plataformas que proporcionam aos clientes executar suas cargas de trabalho de IA em qualquer ambiente
Nuvem híbrida aberta
Veja como construímos um futuro mais flexível com a nuvem híbrida
Segurança
Veja as últimas novidades sobre como reduzimos riscos em ambientes e tecnologias
Edge computing
Saiba quais são as atualizações nas plataformas que simplificam as operações na borda
Infraestrutura
Saiba o que há de mais recente na plataforma Linux empresarial líder mundial
Aplicações
Conheça nossas soluções desenvolvidas para ajudar você a superar os desafios mais complexos de aplicações
Virtualização
O futuro da virtualização empresarial para suas cargas de trabalho on-premise ou na nuvem