Chez Red Hat, nous considérons que les critères de base pour une IA Open Source impliquent d'associer les pondérations des modèles sous licence Open Source et les composants logiciels Open Source.
Il y a plus de trente ans, nous avons perçu le potentiel du développement et des licences Open Source comme un moyen de créer des logiciels plus performants pour stimuler l'innovation informatique. 30 millions de lignes de code plus tard, Linux s'est développé pour devenir le logiciel Open Source de référence, et même le logiciel le plus utilisé à ce jour. Notre engagement pour les principes de l'Open Source se poursuit, non seulement dans notre modèle économique, mais aussi dans le cadre de la culture de notre entreprise. Nous sommes convaincus que ces concepts peuvent avoir les mêmes effets sur l'intelligence artificielle (IA) s'ils sont mis en œuvre de la bonne manière. Il existe cependant un clivage distinct dans le monde des technologies sur la définition de cette « bonne manière ».
L'IA, en particulier les grands modèles de langage pilotant l'IA générative, ne peut pas être considérée comme un logiciel Open Source. Contrairement aux logiciels, les modèles d'IA sont principalement constitués de pondérations de modèles, c'est-à-dire des paramètres numériques qui déterminent la manière dont un modèle traite des entrées, ainsi que les connexions qu'il établit entre différents points de données. Les pondérations de modèles entraînées sont le résultat d'un important processus d'entraînement qui implique de grandes quantités de données soigneusement préparées, mélangées et traitées.
Bien que les pondérations des modèles ne soient pas des logiciels, elles remplissent une fonction comparable à celle du code. Pour faire simple, on pourrait dire que ces données constituent le code source du modèle, ou s'en approchent. Dans le monde de l'Open Source, le code source est généralement défini comme la « forme recommandée » à utiliser pour apporter des modifications au logiciel. Les données d'entraînement seules ne remplissent pas ce rôle, en raison de leur grande taille et du processus complexe de préentraînement qui crée un lien très fin et indirect entre celles-ci et les pondérations entraînées, ainsi que le comportement du modèle qui en résulte.
La majorité des améliorations apportées aux modèles d'IA aujourd'hui dans la communauté n'impliquent pas l'accès aux données d'entraînement d'origine ni leur manipulation. Elles sont plutôt le résultat de modifications apportées aux pondérations des modèles ou d'un processus de réglage fin qui peut également servir à ajuster les performances des modèles. La liberté d'apporter ces améliorations aux modèles requiert que les pondérations soient publiées avec toutes les autorisations dont les utilisateurs bénéficient dans le cadre des licences Open Source.
Notre vision de l'IA Open Source
Nous considérons que la condition minimale d'une IA Open Source repose sur la combinaison des pondérations de modèles sous licence Open Source et des composants logiciels Open Source. Il s'agit d'un point de départ de l'IA Open Source, plutôt qu'un objectif final. Nous encourageons la communauté Open Source, les organismes de réglementation et le secteur à poursuivre leur travail en faveur d'une plus grande transparence et d'une meilleure adéquation avec les principes du développement Open Source lors de l'entraînement et du réglage fin des modèles d'IA.
C'est notre vision de la façon dont nous pouvons, en tant qu'écosystème de logiciels Open Source, nous engager dans l'IA Open Source. Il ne s'agit pas d'une tentative de formuler une définition formelle, comme celle entreprise par l'OSI (Open Source Initiative) avec l'OSAID (Open Source AI Definition). À ce jour, notre point de vue s'appuie simplement sur l'analyse de ce qui rend l'IA Open Source réalisable et accessible au plus grand nombre possible de communautés, d'entreprises et de fournisseurs.
Nous avons mis en pratique ce point de vue au travers de notre travail au sein des communautés Open Source, par exemple avec le projet InstructLab, ainsi que notre travail sur la famille de modèles Granite sous licence Open Source avec IBM Research. L'outil InstructLab élimine considérablement les obstacles qui empêchent des utilisateurs autres que des data scientists de contribuer aux modèles d'IA. Avec InstructLab, des spécialistes de tous les secteurs peuvent ajouter leurs connaissances et compétences à InstructLab, à la fois pour un usage interne et pour contribuer à la mise en place d'un modèle d'IA Open Source partagé et largement accessible pour les communautés en amont.
La famille de modèles Granite 3.0 est conçue pour de nombreux cas d'utilisation de l'IA, de la génération de code au traitement du langage naturel, en passant par l'extraction d'informations dans de grands ensembles de données, toujours sous licence Open Source permissive. Nous avons aidé IBM Research à proposer une famille de modèles de code Granite pour le monde Open Source, et nous continuons de soutenir ces modèles, à la fois d'un point de vue Open Source et dans le cadre de notre offre Red Hat AI.
L'onde de choc provoquée par les annonces récentes de DeepSeek montre les effets de l'innovation Open Source sur l'IA, à la fois au niveau des modèles et au-delà. L'approche de DeepSeek soulève quelques questions, notamment liées au fait que la licence du modèle ne précise pas comment il a été produit, ce qui vient encore renforcer le besoin de transparence. Pour autant, ce bouleversement confirme notre vision de l'avenir de l'IA : un cadre ouvert, centré sur des modèles plus petits, optimisés et ouverts, qui peuvent être personnalisés selon les cas d'utilisation spécifiques des données d'entreprise, où qu'elles se trouvent dans le cloud hybride.
Développer l'IA Open Source au-delà des modèles
Les technologies Open Source et les principes de développement sont au cœur de nos offres pour l'IA, à l'image de notre gamme de produits Red Hat AI. Red Hat OpenShift AI s'appuie sur Kubernetes, KubeFlow et des conteneurs OCI (Open Container Initiative, ainsi que sur d'autres technologies Open Source cloud-native. Red Hat Enterprise Linux AI (RHEL AI) intègre la famille de grands modèles de langage Granite sous licence Open Source d'IBM ainsi que le projet Open Source InstructLab.
Notre travail dans le domaine de l'IA Open Source va bien au-delà d'InstructLab et de la famille de modèles Granite : il s'étend aux outils et aux plateformes nécessaires pour consommer et utiliser l'IA de manière productive. Nous participons à un nombre croissant de projets et de communautés en amont, et nous avons aussi lancé nos propres projets, parmi lesquels :
- RamaLama, un projet Open Source qui vise à simplifier la gestion et la mise à disposition des modèles d'IA en local ;
- TrustyAI, un kit d'outils Open Source permettant de créer des workflows d'IA plus responsables ;
- Climatik, un projet dont l'objectif est de contribuer à rendre l'IA plus durable en matière de consommation d'énergie ;
- Podman AI Lab, une boîte à outils de développement visant à faciliter l'expérimentation avec les grands modèles de langage Open Source.
Nous avons récemment annoncé l'acquisition de Neural Magic, qui vient concrétiser notre vision de l'IA : les entreprises peuvent désormais adapter des modèles d'IA optimisés et de petite taille (y compris des modèles sous licence Open Source) en fonction de leurs données, où qu'elles se trouvent dans le cloud hybride. Les services informatiques peuvent ensuite utiliser le serveur d'inférences vLLM pour alimenter les décisions et le résultat de ces modèles, et ainsi contribuer à la création d'une pile d'IA reposant sur des technologies transparentes et prises en charge.
Nous pensons que l'IA Open Source repose sur le cloud hybride. Le cloud hybride offre la flexibilité indispensable pour choisir l'environnement adapté à chaque charge de travail d'IA, ce qui permet d'optimiser les performances, les coûts, l'évolutivité et la sécurité. Nos plateformes, nos objectifs et notre entreprise soutiennent cet effort, et nous avons hâte de collaborer avec des partenaires du secteur, nos clients et l'ensemble de la communauté Open Source pour faire avancer l'innovation dans le domaine de l'IA Open Source.
Cette collaboration ouverte dans le domaine de l'IA offre un potentiel considérable. Nous envisageons un avenir axé sur la transparence des modèles et de leur entraînement. Quel que soit le rythme d'évolution de l'IA, nous continuerons de soutenir les efforts visant à repousser les limites de la démocratisation et de l'ouverture du monde de l'IA.
À propos de l'auteur
Chris Wright is senior vice president and chief technology officer (CTO) at Red Hat. Wright leads the Office of the CTO, which is responsible for incubating emerging technologies and developing forward-looking perspectives on innovations such as artificial intelligence, cloud computing, distributed storage, software defined networking and network functions virtualization, containers, automation and continuous delivery, and distributed ledger.
During his more than 20 years as a software engineer, Wright has worked in the telecommunications industry on high availability and distributed systems, and in the Linux industry on security, virtualization, and networking. He has been a Linux developer for more than 15 years, most of that time spent working deep in the Linux kernel. He is passionate about open source software serving as the foundation for next generation IT systems.
Parcourir par canal
Automatisation
Les dernières nouveautés en matière d'automatisation informatique pour les technologies, les équipes et les environnements
Intelligence artificielle
Actualité sur les plateformes qui permettent aux clients d'exécuter des charges de travail d'IA sur tout type d'environnement
Cloud hybride ouvert
Découvrez comment créer un avenir flexible grâce au cloud hybride
Sécurité
Les dernières actualités sur la façon dont nous réduisons les risques dans tous les environnements et technologies
Edge computing
Actualité sur les plateformes qui simplifient les opérations en périphérie
Infrastructure
Les dernières nouveautés sur la plateforme Linux d'entreprise leader au monde
Applications
À l’intérieur de nos solutions aux défis d’application les plus difficiles
Programmes originaux
Histoires passionnantes de créateurs et de leaders de technologies d'entreprise