Potion Bottle Icon Manuel d'alchimie du code Potion Bottle Icon

L'IA générative Open Source: Open-washing ?

- 789 mots - Temps de lecture estimé: 4 minutes

Note : Ce contenu faisait auparavant partie du site web ouimaisjellm.ca. Il a été importé ici pour archivage.

J’ai assisté aujourd’hui à un panel sur l’IA générative “Open-Source”. Je dois admettre que certains projets s’approchent de la philosophie en question. Mais comme défendeur du logiciel libre, disons que je suis plus exigeant que de “fournir les poids”. C’est la même maudite affaire que fournir le “binaire” pour un logiciel privatif. Oui, on peut le “hacker” avec un désassembleur, mais on n’a toujours pas le code source. Surtout, ça demande des compétences et des ressources qui sont très rares.

🌘 La reproductibilité

Une notion fondamentale, avant de prétendre parler d’ouverture, c’est au moins d’avoir la reproductibilité. Je fais ici le pont entre la définition de la science, et celle de la science ouverte. Tout objet scientifique est reproductible. Sinon, on appelle ça du bricolage.

Pour un modèle d’apprentissage automatique, la reproductibilité doit comprendre trois éléments:

On pourrait aussi ajouter qu’il faut connaître les tolérances dans les mesures et les variances dans les sources de données.

🌘 Les quatre libertés, version IA

Pour qu’un modèle soit “libre”, on devrait, selon moi, respecter les 4 caractéristiques suivantes, qui sont essentiellement celles d’un logiciel libre, adaptées pour un modèle, qui en soi n’est pas un logiciel, mais un artéfact de données.

🌘 Défaire quelques mensonges

Ça implique ici de déconstruire quelques “mensonges” sur les prétendus modèles “Open Source”

L’apparent consensus sur l’ouverture des poids qui a été présentée dans le panel auquel j’ai assisté me fait douter des intentions pour la suite. Est-ce que c’est juste devenu une forme de bombage de torse de pouvoir faire des modèles “ouverts” ?

🌘 Les sujets ignorés

Un autre enjeu qui entoure les modèles de langage, en particulier, c’est le matériel. En ce moment, tout le matériel informatique, ou presque, qui permet d’exécuter ces modèles, est protégé par des brevets.

L’entreprise NVIDIA fabrique la plupart des processeurs pouvant interpréter des modèles d’IA générative. C’est vrai qu’on a maintenant quelques options additionnelles, avec les processeurs ARM de la série M d’Apple, les processeurs Snapdragon de Qualcomm, les processeurs graphiques Mali de AllWinner et les processeurs Ryzen AI de AMD, mais aucune de ces options n’est vraiment parallélisable en ce moment sans passer par un réseau Ethernet, alors que NVIDIA ont développé le NVLink qui permet d’assembler plusieurs processeurs ensemble.

Ce que je souhaite, c’est garder les principes qu’on a développé dans les 40 dernières années sur le logiciel libre, le matériel ouvert et la culture de la science ouverte dans le domaine de l’intelligence artificielle.

Qu’en penses-tu ? J’aimerais avoir tes questions sur ce sujet !

Pour le prochain Ask-Me-Anything ! Tu as le lien en haut de la page !

Abonne-toi au fil RSS pour ne rien manquer.

Étiquettes