Note : Ce contenu faisait auparavant partie du site web ouimaisjellm.ca. Il a été importé ici pour archivage.

Quand on étudie en informatique, il y a un cours que personne n’aime vraiment à la 2e session qui s’appelle Structures de données. Dans ce cours, on apprend ce qu’est une file, une pile, une liste simplement chaînée, un arbre binaire…,

Après ça, c’est juste un mauvais souvenir, pour la plupart. Jusqu’à ce que tu aies à travailler avec des algorithmes qui traitent des données massives.

La plupart des “experts” en IA n’ont aucune de ces notions, et c’est pour ça qu’on lit toutes sortes de “théories” sur le comportement des réseaux sociaux, des moteurs de recherche et des modèles de langage. L’algorithme de notre fil a “changé” et on peut en “découvrir le secret”, il faut “optimiser son SEO pour les nouveautés de Google” ou “faire de l’ingénierie de prompt qui s’adaptent à la personnalité des modèles”. C’est le langage des pseudo-experts. Parce que oui, pas mal tout le monde ici qui parle d’IA et d’algorithme n’a aucune crisse d’idée du sujet.

L’algorithme des réseaux sociaux évolue constamment et surtout, il est personnalisé à chacun de nos profils en temps réel. Donc, au mieux, on observe une réalisation de “son” algorithme à un moment donné. Quand le dieu des coaches LinkedIn a percé le secret, c’est celui de ta crédulité et de ton portefeuille.

L’algorithme des moteurs de recherche est une recherche pondérée dans un index inversé. L’index utilise une version sophistiquée de la métrique TF-IDF qui identifie les mots clés fréquents dans un texte, mais pas dans les autres. Donc, le sujet du texte. Les autres critères sont basés sur un graphe formé par tous les URL sur le web qui définit le concept d’autorité ou sur des objectifs commerciaux secrets qui sont optimisés avec un algorithme de type descente de gradient. C’est pas mal ça. Tous les autres “hacks” vont être de la poudre aux yeux.

Enfin, pour l’IA générative, c’est un outil de complétion de texte. Donc, si tu envoies des données linéaires comme un texte à compléter de type “production écrite”, tu vas avoir une meilleure réponse que si tu envoies des données en arbre comme du HTML, un dialogue complexe ou un nuage d’idées. Tout simplement parce que c’est un algorithme qui reçoit une liste en entrée, et ajoute un jeton à la suite à chaque itération, sous la forme d’une liste chaînée. Toute donnée en arbre va être plus difficile à interpréter et va aller chercher les limites des mécanismes d’attention, qui recherchent des séquences de mots connexes, pas des bouts de branche !

Compte tenu du talent et de l’expertise en IA et en algorithmes qu’on trouve sur les réseaux sociaux, je suis convaincu que l’impact le plus significatif de l’IA générative a été la disparition du Lorem ipsum. Ce texte inutile qui servait à remplir le vide, en attendant d’avoir de quoi à dire ! Maintenant, tout le monde en a un sur mesure !

Étiquettes