
Les grandes architectures de l'intelligence artificielle
By Christian PELLEGEAYLength9h 25m
About this audiobook
Vous utilisez déjà l’intelligence artificielle au quotidien… mais comprenez-vous réellement ce qui se cache derrière ses prouesses ?
Ce livre vous ouvre les portes de cet univers fascinant en révélant, avec clarté et pédagogie, les mécanismes qui transforment des calculs en intelligence apparente. Sans jargon inutile ni équations complexes, vous découvrirez comment les réseaux de neurones apprennent, pourquoi le mécanisme d’attention a révolutionné l’IA, et ce qui distingue les grands modèles actuels.
Accessible à tous, cet ouvrage vous permet de saisir l’essentiel : fonctionnement, forces, limites et avenir de ces technologies qui redessinent notre monde.
Loin d’être magique, l’IA devient ici compréhensible… et encore plus captivante.
Audiobook details
GenreTechnology, Education and Learning
Length9 hrs 25 mins
Narrated byListen with 1,000+ voices
FormateBook with Audio
Publish dateAug 18, 2013
LanguageFrench
Table of contents
1Introduction
821. Ce que signifie vraiment « milliards de paramètres »
2Dédicace
832. Les données d'entraînement : nourrir un géant affamé
3Remerciements
843. La mécanique de l'entraînement : du chaos à la cohérence
4Avant-propos
854. L'infrastructure : des fermes de calcul et des défis d'ingénierie
5Introduction
865. De la pré-formation au modèle utilisable : le fine-tuning et le RLHF
Show all chaptersShow less
6Ce que vous allez découvrir
876. Les lois d'échelle : quand la taille devient une science
7Comment utiliser ce livre
88Chapitre 11 — GPT-4, Claude, Gemini : sous le capot des géants du langage
8Citations inspirantes
891. GPT-4 : la puissance industrialisée d'OpenAI
9Partie 1 : Les fondations, Comprendre avant de construire
902. Claude : la philosophie Anthropic inscrite dans l'architecture
10Chapitre 1 — L'intelligence artificielle n'est pas magique : ce qui se cache vraiment derrière le rideau
913. Gemini : quand Google reconstruit depuis les fondations
111.1 — Le grand malentendu : l'IA ne pense pas, elle calcule
924. Ce que les benchmarks ne disent pas
121.2 — Ce que l'IA fait vraiment : reconnaître des patterns dans des données
935. Les choix d'entraînement : données, échelle et compromis éthiques
131.3 — Une brève histoire sans romantisme : comment on est arrivé là
946. Converger ou diverger ? L'avenir de la compétition architecturale
141.4 — Les trois grandes familles : supervisé, non supervisé, par renforcement
95Chapitre 12 — Les limites que personne n'aime avouer : hallucinations, biais et frontières du sens
151.5 — Ce que le rideau cache : données, puissance de calcul et ingénierie humaine
96Section 1 — Les hallucinations : quand le modèle invente avec aplomb
161.6 — Pourquoi comprendre tout ça vous rend plus puissant
97Section 2 — Les biais : le miroir déformant des données humaines
17📌 Résumé du chapitre
98Section 3 — Les frontières du sens : comprendre ou simuler ?
18Chapitre 2 — Le neurone artificiel : quand la biologie inspire la machine
99Section 4 — Les limites structurelles : mémoire, contexte et longueur
191. Le cerveau humain comme source d'inspiration : une leçon d'humilité
100Section 5 — Le coût invisible : énergie, ressources et équité d'accès
202. Le neurone artificiel : anatomie d'une abstraction mathématique
101Section 6 — Comment utiliser les LLM malgré leurs limites : une approche pratique et lucide
213. Les fonctions d'activation : l'étincelle qui donne vie au calcul
102Partie 4 — Les GAN : l'IA qui crée en se battant contre elle-même
224. Du neurone isolé au perceptron : la première architecture apprenante
103Chapitre 13 — L'idée de génie de Ian Goodfellow : le générateur contre le discriminateur
235. Les poids comme mémoire : comment un neurone "sait" quelque chose
104Section 1 — La nuit où tout a commencé : Montréal, 2014
246. L'héritage du neurone artificiel : une abstraction qui a résisté à l'épreuve du temps
105Section 2 — L'anatomie d'un affrontement : le générateur et le discriminateur
25Chapitre 3 — Les réseaux de neurones profonds : empiler les couches pour apprendre le monde
106Section 3 — La mécanique profonde : ce qui se passe vraiment pendant l'entraînement
26Section 1 — De la couche unique à la profondeur : pourquoi « empiler » change tout
107Section 4 — L'espace latent : la géographie secrète de la créativité artificielle
27Section 2 — L'anatomie d'un réseau profond : couches, connexions et flux d'information
108Section 5 — Pourquoi l'idée était vraiment révolutionnaire : contexte et rupture
28Section 3 — Les fonctions d'activation : la décision au cœur du neurone
109Section 6 — Du bar de Montréal au monde réel : les premières applications et leur impact
29Section 4 — La force des représentations : comment un réseau profond voit le monde
110📌 Résumé du chapitre
30Section 5 — Les défis du profond : surapprentissage, initialisation et régularisation
111Chapitre 14 — Visages, tableaux, sons : ce que les GAN sont capables de fabriquer
31Section 6 — Les grandes familles de réseaux profonds : une carte du territoire
1121. La génération de visages : quand la machine apprend le visage humain
32Section 7 — Pourquoi la profondeur est irremplaçable : ce que la théorie nous dit
1132. L'art et la peinture : les GAN comme compagnons de création
33Chapitre 4 — Apprendre par l'exemple : la rétropropagation expliquée simplement
1143. La synthèse vidéo et les deepfakes : la réalité augmentée par le mensonge
34Avant d'apprendre, il faut mesurer son ignorance
1154. La synthèse audio et musicale : quand les GAN apprennent à écouter
35La descente de gradient : trouver le bas de la vallée
1165. Les GAN dans les secteurs professionnels : médecine, mode et jeux vidéo
36La rétropropagation : remonter le fleuve de l'erreur
1176. Les zones d'ombre : manipulation, droits et responsabilité
37Pourquoi ça a mis si longtemps à fonctionner
118Chapitre 15 — StyleGAN, CycleGAN, Pix2Pix : les variantes qui ont conquis l'industrie créative
38En pratique : mini-batch, stochasticité et optimiseurs modernes
119Section 1 — StyleGAN : quand l'IA apprend à sculpter le visage humain
39L'entraînement comme voyage : généralisation, surapprentissage et la règle d'or
120Section 2 — CycleGAN : la magie de la traduction sans dictionnaire
40📌 Résumé du chapitre
121Section 3 — Pix2Pix : la traduction image-à-image, pixel par pixel
41Partie 2 — Les Transformers : la révolution silencieuse
122Section 4 — Ce que ces trois architectures ont en commun : les principes du contrôle créatif
42Chapitre 5 — Avant les Transformers : pourquoi les anciennes architectures avaient atteint leurs limites
123Section 5 — L'héritage industriel : comment ces architectures ont redessiné le paysage des outils créatifs
431. Le traitement séquentiel : une logique humaine, un problème machine
124Section 6 — Les limites spécifiques et les zones de vigilance
442. Les LSTM et GRU : les rustines brillantes qui n'ont pas tout résolu
125Chapitre 16 — Les GAN en crise d'identité : forces, faiblesses et instabilité d'entraînement
453. L'attention comme rustine : une solution partielle qui contenait la graine de la révolution
126Les forces réelles des GAN : ce qu'ils font mieux que les autres
464. Les CNN appliqués au texte : une autre voie, d'autres limites
127Le cauchemar de l'entraînement : pourquoi deux réseaux qui s'affrontent c'est instable par nature
475. Le coût de la complexité croissante : quand ajouter des couches devient un jeu perdant
128Les failles structurelles des GAN : ce que l'architecture ne peut pas résoudre
486. Le tableau clinique complet : un récapitulatif des faiblesses
129Mesurer la qualité d'un GAN : le défi des métriques
49📌 Résumé du chapitre
130Les tentatives pour dompter le chaos : régularisations, variantes architecturales et tricks du métier
50Chapitre 6 — L'attention, s'il vous plaît ! Le mécanisme qui a tout changé
131L'héritage des GAN : ce qu'ils ont légué à l'IA générative moderne
51La mémoire défaillante des machines qui lisent en séquence
132Partie 5 — Les modèles de diffusion : l'art de reconstruire depuis le chaos
52Regarder tout à la fois : le principe fondateur de l'attention
133Chapitre 17 — Le bruit comme point de départ : l'idée contre-intuitive qui fonctionne
53Requêtes, clés et valeurs : la mécanique interne démystifiée
1341. Pourquoi partir du chaos ? L'intuition derrière une idée folle
54L'attention multi-têtes : regarder plusieurs fois, différemment
1352. Le processus de bruitage : apprendre à détruire pour mieux reconstruire
55L'attention croisée : le pont entre comprendre et produire
1363. La débruitage appris : le cœur du réseau U-Net
56Ce que l'attention a changé pour toujours
1374. Le guidage par le texte : comment le modèle comprend vos instructions
57Chapitre 7 — Anatomie d'un Transformer : encodeur, décodeur et tout ce qui les relie
1385. L'espace latent : accélérer sans sacrifier la qualité
58Section 1 — La vision d'ensemble : une machine à traiter le contexte
1396. Du chaos à la création : la magie visible de la génération pas à pas
59Section 2 — L'encodeur : l'art de comprendre ce qui est dit
140Chapitre 18 — Stable Diffusion, DALL·E, Midjourney : anatomie des créateurs d'images
60Section 3 — Les embeddings positionnels : se souvenir que l'ordre compte
1411. Le cadre commun : ce que tous ces modèles partagent
61Section 4 — L'attention multi-têtes : voir sous plusieurs angles à la fois
1422. Stable Diffusion : la révolution open source
62Section 5 — Le décodeur et l'attention croisée : le dialogue entre comprendre et produire
1433. DALL·E : la vision d'OpenAI entre contrôle et puissance
63Section 6 — Les connexions résiduelles, la normalisation et le réseau feedforward : les rouages discrets qui font tourner la machine
1444. Midjourney : l'esthétique comme philosophie
64📌 Résumé du chapitre
1455. Anatomie comparée : ce qui distingue vraiment ces trois systèmes
65Chapitre 8 — BERT, GPT, T5 : trois enfants du même père, trois destins différents
1466. Ce que l'entraînement révèle sur les limites communes
66La même origine, des philosophies opposées
147Chapitre 19 — Diffusion vs GAN : pourquoi un challenger a détrôné le roi en trois ans
67BERT : l'intelligence qui lit dans les deux sens
1481. Le règne des GAN : une domination aussi brillante que fragile
68GPT : l'intelligence qui prédit la suite du monde
1492. L'irruption des modèles de diffusion : une idée venue d'ailleurs
69T5 : quand tout devient traduction de texte en texte
1503. Le duel technique : ce qui différencie vraiment les deux approches
70Trois destins industriels : qui a gagné quoi ?
1514. Pourquoi le timing a tout changé : le rôle des données, des GPU et de l'open source
71Ce que cette divergence nous apprend sur l'avenir des architectures
1525. Le verdict du terrain : ce que les professionnels ont réellement adopté
72📌 Résumé du chapitre
1536. Leçons durables : ce que ce basculement nous apprend sur l'évolution des architectures
73Partie 3 — Les LLM : quand la machine apprend à parler
154Chapitre 20 — L'avenir des architectures : multimodalité, agents autonomes et ce qui vient ensuite
74Chapitre 9 — Qu'est-ce qu'un grand modèle de langage ? Bien plus qu'un correcteur orthographique
155La multimodalité : quand la machine apprend à percevoir le monde entier
75La prédiction du mot suivant : une idée déceptive aux conséquences vertigineuses
156Les agents autonomes : de la réponse à l'action
76Ce que « grand » veut vraiment dire
157L'efficacité comme nouvelle frontière : faire plus avec moins
77De la langue au monde : comment un LLM construit une représentation de la réalité
158L'alignement et la robustesse : construire des architectures dignes de confiance
78Le fine-tuning et l'alignement : transformer un modèle brut en assistant utile
159Vers une IA incarnée : au-delà du texte et des pixels
79Ce que les LLM font vraiment quand ils « comprennent »
160Conclusion générale: Un immense MERCI !
80Les LLM dans la pratique : capacités réelles, usages transformateurs
161Lexique des termes clés: À propos de l'auteur
81Chapitre 10 — L'entraînement à l'échelle : des milliards de paramètres, des milliards de mots