Comment fonctionne un LLM ? (IA calculateur de probabilités, pas penseur)
Un LLM calcule mathématiquement le champ sémantique d’un énoncé – qu’il s’agisse d’un prompt, d’une question ou d’un texte – en transformant chaque mot, chaque phrase, en vecteurs dans un espace à très haute dimension. Ces vecteurs sont le résultat d’un apprentissage statistique sur des milliards de textes. Le sens, pour le modèle, se réduit à des relations géométriques (proximités, directions, distances) entre ces vecteurs. Le modèle ne « comprend » pas plus qu’un nuage de points ne comprend les objets qu’il représente. C’est à la fois très puissant (car cela permet de générer des textes cohérents, des métaphores, des raisonnements par analogie) et très limité (car il n’y a ni intention, ni croyance, ni ancrage dans le monde réel). Un LLM calcule mathématiquement le champ sémantique de l’énoncé. C’est une machine à projeter du langage sur des espaces vectoriels, et à naviguer dans ces espaces pour produire des réponses probables. Bien que redoutablement efficace pour bien des tâc...