RETOUR
Demystifying AI: Understanding the Core Concepts behind AllAi Part I - Neural Networks

Démystifier l'IA : comprendre les concepts fondamentaux d’AllAi Partie I - Réseaux neuronaux

Cet article est le premier d'une série de trois articles intitulée "Démystifier l'IA : comprendre les concepts fondamentaux d'AllAi". AllAi Productivity Plateform, alimentée par l'IA, a été créée par OSF Digital pour améliorer les services pilotés par Salesforce. AllAi optimise les flux de travail et accroît l'efficacité des développeurs, des chefs de projet, des ingénieurs QA et des business analysts. Avant de voir comment AllAi exploite l'intelligence artificielle pour améliorer la productivité, il est essentiel d'explorer les principes fondamentaux de l'IA, en commençant par les réseaux neuronaux.

L’environnement IA

Des soins de santé à la finance, l'IA révolutionne le fonctionnement des entreprises et la façon dont nous interagissons avec la technologie. Dans le commerce de détail, les suggestions marketing personnalisées sont passées des e-mails du type "Bonjour, [Votre nom]" à des recommandations de produits nuancées basées sur votre historique de navigation. Dans le domaine de la santé, l'IA facilite les diagnostics et permet même de prédire les épidémies. Quel que soit le secteur, l'IA établit de nouvelles normes.

Demystifying AI: Understanding the Core Concepts behind AllAi Part I - Neural Networks
AI impact across industries.

L'essor des DNN et des LLM

Les récentes avancées dans le domaine des réseaux neuronaux profonds (DNN) ont propulsé l'IA vers l'avant, conduisant à l'essor des grands modèles de langage (LLM). Ces modèles ont porté le traitement du langage naturel à un tout autre niveau, permettant aux chatbots, aux services de traduction et aux outils de création de contenu de se développer comme jamais auparavant. Vous êtes-vous déjà demandé comment fonctionnent des modèles tels que GPT-4 (le moteur de ChatGPT)? Pour beaucoup, ces outils semblent presque magiques, capables de générer à la demande des textes semblables à ceux des humains, sans frontières ni limites apparentes. Cependant, les principes sous-jacents sont loin d'être de la sorcellerie. En épluchant les couches, nous allons démystifier ces technologies et vous en donner une vision plus claire.

Demystifying AI: Understanding the Core Concepts behind AllAi Part I - Neural Networks
A daily interaction with ChatGPT.

Démystifier les réseaux neuronaux artificiels

Pour comprendre ce qui motive ces applications d'IA avancées, il faut commencer par le concept de réseaux neuronaux. Considérés comme le "cerveau" de l'IA, les réseaux neuronaux s'inspirent de la manière dont les neurones du cerveau humain traitent les informations. Ils se composent de nœuds interconnectés (neurones) qui communiquent par le biais de connexions pondérées, à l'instar des synapses du cerveau. Chaque connexion a un poids et chaque neurone a un seuil qui détermine le moment où il s'active. Les poids sont appris par un processus appelé rétropropagation, qui est le mécanisme de formation responsable de l'"apprentissage" des réseaux neuronaux. Cette technique permet au réseau d'améliorer sa précision en analysant les exemples d'entrée et de sortie passés et en procédant aux ajustements nécessaires. En d'autres termes, elle affine le système en fonction de ce qui fonctionne et de ce qui ne fonctionne pas. Avec suffisamment de données d'entraînement, les réseaux neuronaux peuvent reconnaître des modèles, faire des prédictions et appliquer leur apprentissage à de nouvelles informations inédites.

Prenons la métaphore simple d'une chaîne de montage d'usine. Chaque travailleur (neurone) reçoit une pièce (données), effectue une tâche spécifique (application de poids et de seuils), puis la transmet à la chaîne. Finalement, le produit final (la prédiction ou la décision finale) est réalisé. Si l'usine fabrique un produit incorrect, le processus est modifié (formation par rétropropagation) afin d'améliorer les résultats futurs.

Demystifying AI: Understanding the Core Concepts behind AllAi Part I - Neural Networks
Basic diagram of an artificial neural network.

Transformers – Une Révolution transformatrice

Les architectures traditionnelles de réseaux neuronaux artificiels ont ouvert la voie, mais le véritable bond en avant s'est produit avec l'introduction d'une nouvelle architecture appelée Transformers par un groupe de chercheurs de Google en collaboration avec des partenaires universitaires. Transformers a révolutionné notre approche du traitement du langage naturel en permettant aux modèles de prêter attention à différentes parties des données d'entrée de manière dynamique. Cela a permis de traiter efficacement de grandes quantités de données tout en maintenant le contexte sur de longs textes. Imaginez que vous lisez un livre dont chaque phrase vous aide à mieux comprendre l'ensemble du chapitre. Les réseaux neuronaux traditionnels avaient du mal à maintenir ce type de conscience contextuelle, mais les transformateurs excellent dans ce domaine. Ils permettent aux modèles de se concentrer sur les parties pertinentes du texte, ce qui rend les opérations plus rapides et plus contextuelles.

Demystifying AI: Understanding the Core Concepts behind AllAi Part I - Neural Networks
Transformer Neural Network. From “Attention is All you Need”.

Raisonnement probabiliste

Les capacités approfondies des LLM doivent beaucoup aux progrès réalisés dans la collecte des données et dans le matériel informatique. Les LLM d'aujourd'hui ont été formés sur de grandes quantités de données, englobant de multiples langues, contextes culturels et sujets. Cet ensemble complet de données permet au modèle "d'apprendre et presque de mémoriser" une partie impressionnante de l'internet. Toutefois, il est essentiel de comprendre que ces modèles fonctionnent sur la base de probabilités. Les LLM sont fondamentalement des machines à deviner avancées, qui prédisent le mot ou l'élément suivant d'une phrase sur la base de modèles précédemment observés. Cette approche probabiliste est la raison pour laquelle ils peuvent sembler si humains tout en produisant occasionnellement des résultats bizarres ou inattendus.

Demystifying AI: Understanding the Core Concepts behind AllAi Part I - Neural Networks
Probabilistic word sampling (with beam search decoding). Source.

Quelle est la prochaine étape ?

Dans notre prochain article, nous nous pencherons plus en détail sur la manière dont les LLM fonctionnent réellement et nous explorerons les possibilités qui s'offrent à nous:

  • Le fonctionnement des LLM
  • Apprentissage Zero-shot & few-shot
  • Ingénierie rapide

Ne manquez pas la suite pour découvrir l'impact de l'IA et la façon dont AllAi peut redéfinir votre expérience Salesforce.

Rodrigo C. Barros

Auteur : Rodrigo C. Barros

Rodrigo C. Barros, PhD, est directeur de l'IA chez OSF Digital, spécialisé dans les solutions d'intelligence artificielle pour la transformation numérique. Il est titulaire d'un doctorat en informatique et en mathématiques computationnelles de l'Université de São Paulo, au Brésil, et est également professeur associé à la PUCRS.