6Ce que vous allez découvrir
876. Les lois d'échelle : quand la taille devient une science
7Comment utiliser ce livre
88Chapitre 11 — GPT-4, Claude, Gemini : sous le capot des géants du langage
8Citations inspirantes
891. GPT-4 : la puissance industrialisée d'OpenAI
9Partie 1 : Les fondations, Comprendre avant de construire
902. Claude : la philosophie Anthropic inscrite dans l'architecture
10Chapitre 1 — L'intelligence artificielle n'est pas magique : ce qui se cache vraiment derrière le rideau
913. Gemini : quand Google reconstruit depuis les fondations
111.1 — Le grand malentendu : l'IA ne pense pas, elle calcule
924. Ce que les benchmarks ne disent pas
121.2 — Ce que l'IA fait vraiment : reconnaître des patterns dans des données
935. Les choix d'entraînement : données, échelle et compromis éthiques
131.3 — Une brève histoire sans romantisme : comment on est arrivé là
946. Converger ou diverger ? L'avenir de la compétition architecturale
141.4 — Les trois grandes familles : supervisé, non supervisé, par renforcement
95Chapitre 12 — Les limites que personne n'aime avouer : hallucinations, biais et frontières du sens
151.5 — Ce que le rideau cache : données, puissance de calcul et ingénierie humaine
96Section 1 — Les hallucinations : quand le modèle invente avec aplomb
161.6 — Pourquoi comprendre tout ça vous rend plus puissant
97Section 2 — Les biais : le miroir déformant des données humaines
17📌 Résumé du chapitre
98Section 3 — Les frontières du sens : comprendre ou simuler ?
18Chapitre 2 — Le neurone artificiel : quand la biologie inspire la machine
99Section 4 — Les limites structurelles : mémoire, contexte et longueur
191. Le cerveau humain comme source d'inspiration : une leçon d'humilité
100Section 5 — Le coût invisible : énergie, ressources et équité d'accès
202. Le neurone artificiel : anatomie d'une abstraction mathématique
101Section 6 — Comment utiliser les LLM malgré leurs limites : une approche pratique et lucide
213. Les fonctions d'activation : l'étincelle qui donne vie au calcul
102Partie 4 — Les GAN : l'IA qui crée en se battant contre elle-même
224. Du neurone isolé au perceptron : la première architecture apprenante
103Chapitre 13 — L'idée de génie de Ian Goodfellow : le générateur contre le discriminateur
235. Les poids comme mémoire : comment un neurone "sait" quelque chose
104Section 1 — La nuit où tout a commencé : Montréal, 2014
246. L'héritage du neurone artificiel : une abstraction qui a résisté à l'épreuve du temps
105Section 2 — L'anatomie d'un affrontement : le générateur et le discriminateur
25Chapitre 3 — Les réseaux de neurones profonds : empiler les couches pour apprendre le monde
106Section 3 — La mécanique profonde : ce qui se passe vraiment pendant l'entraînement
26Section 1 — De la couche unique à la profondeur : pourquoi « empiler » change tout
107Section 4 — L'espace latent : la géographie secrète de la créativité artificielle
27Section 2 — L'anatomie d'un réseau profond : couches, connexions et flux d'information
108Section 5 — Pourquoi l'idée était vraiment révolutionnaire : contexte et rupture
28Section 3 — Les fonctions d'activation : la décision au cœur du neurone
109Section 6 — Du bar de Montréal au monde réel : les premières applications et leur impact
29Section 4 — La force des représentations : comment un réseau profond voit le monde
110📌 Résumé du chapitre
30Section 5 — Les défis du profond : surapprentissage, initialisation et régularisation
111Chapitre 14 — Visages, tableaux, sons : ce que les GAN sont capables de fabriquer
31Section 6 — Les grandes familles de réseaux profonds : une carte du territoire
1121. La génération de visages : quand la machine apprend le visage humain
32Section 7 — Pourquoi la profondeur est irremplaçable : ce que la théorie nous dit
1132. L'art et la peinture : les GAN comme compagnons de création
33Chapitre 4 — Apprendre par l'exemple : la rétropropagation expliquée simplement
1143. La synthèse vidéo et les deepfakes : la réalité augmentée par le mensonge
34Avant d'apprendre, il faut mesurer son ignorance
1154. La synthèse audio et musicale : quand les GAN apprennent à écouter
35La descente de gradient : trouver le bas de la vallée
1165. Les GAN dans les secteurs professionnels : médecine, mode et jeux vidéo
36La rétropropagation : remonter le fleuve de l'erreur
1176. Les zones d'ombre : manipulation, droits et responsabilité
37Pourquoi ça a mis si longtemps à fonctionner
118Chapitre 15 — StyleGAN, CycleGAN, Pix2Pix : les variantes qui ont conquis l'industrie créative
38En pratique : mini-batch, stochasticité et optimiseurs modernes
119Section 1 — StyleGAN : quand l'IA apprend à sculpter le visage humain
39L'entraînement comme voyage : généralisation, surapprentissage et la règle d'or
120Section 2 — CycleGAN : la magie de la traduction sans dictionnaire
40📌 Résumé du chapitre
121Section 3 — Pix2Pix : la traduction image-à-image, pixel par pixel
41Partie 2 — Les Transformers : la révolution silencieuse
122Section 4 — Ce que ces trois architectures ont en commun : les principes du contrôle créatif
42Chapitre 5 — Avant les Transformers : pourquoi les anciennes architectures avaient atteint leurs limites
123Section 5 — L'héritage industriel : comment ces architectures ont redessiné le paysage des outils créatifs
431. Le traitement séquentiel : une logique humaine, un problème machine
124Section 6 — Les limites spécifiques et les zones de vigilance
442. Les LSTM et GRU : les rustines brillantes qui n'ont pas tout résolu
125Chapitre 16 — Les GAN en crise d'identité : forces, faiblesses et instabilité d'entraînement
453. L'attention comme rustine : une solution partielle qui contenait la graine de la révolution
126Les forces réelles des GAN : ce qu'ils font mieux que les autres
464. Les CNN appliqués au texte : une autre voie, d'autres limites
127Le cauchemar de l'entraînement : pourquoi deux réseaux qui s'affrontent c'est instable par nature
475. Le coût de la complexité croissante : quand ajouter des couches devient un jeu perdant
128Les failles structurelles des GAN : ce que l'architecture ne peut pas résoudre
486. Le tableau clinique complet : un récapitulatif des faiblesses
129Mesurer la qualité d'un GAN : le défi des métriques
49📌 Résumé du chapitre
130Les tentatives pour dompter le chaos : régularisations, variantes architecturales et tricks du métier
50Chapitre 6 — L'attention, s'il vous plaît ! Le mécanisme qui a tout changé
131L'héritage des GAN : ce qu'ils ont légué à l'IA générative moderne
51La mémoire défaillante des machines qui lisent en séquence
132Partie 5 — Les modèles de diffusion : l'art de reconstruire depuis le chaos
52Regarder tout à la fois : le principe fondateur de l'attention
133Chapitre 17 — Le bruit comme point de départ : l'idée contre-intuitive qui fonctionne
53Requêtes, clés et valeurs : la mécanique interne démystifiée
1341. Pourquoi partir du chaos ? L'intuition derrière une idée folle
54L'attention multi-têtes : regarder plusieurs fois, différemment
1352. Le processus de bruitage : apprendre à détruire pour mieux reconstruire
55L'attention croisée : le pont entre comprendre et produire
1363. La débruitage appris : le cœur du réseau U-Net
56Ce que l'attention a changé pour toujours
1374. Le guidage par le texte : comment le modèle comprend vos instructions
57Chapitre 7 — Anatomie d'un Transformer : encodeur, décodeur et tout ce qui les relie
1385. L'espace latent : accélérer sans sacrifier la qualité
58Section 1 — La vision d'ensemble : une machine à traiter le contexte
1396. Du chaos à la création : la magie visible de la génération pas à pas
59Section 2 — L'encodeur : l'art de comprendre ce qui est dit
140Chapitre 18 — Stable Diffusion, DALL·E, Midjourney : anatomie des créateurs d'images
60Section 3 — Les embeddings positionnels : se souvenir que l'ordre compte
1411. Le cadre commun : ce que tous ces modèles partagent
61Section 4 — L'attention multi-têtes : voir sous plusieurs angles à la fois
1422. Stable Diffusion : la révolution open source
62Section 5 — Le décodeur et l'attention croisée : le dialogue entre comprendre et produire
1433. DALL·E : la vision d'OpenAI entre contrôle et puissance
63Section 6 — Les connexions résiduelles, la normalisation et le réseau feedforward : les rouages discrets qui font tourner la machine
1444. Midjourney : l'esthétique comme philosophie
64📌 Résumé du chapitre
1455. Anatomie comparée : ce qui distingue vraiment ces trois systèmes
65Chapitre 8 — BERT, GPT, T5 : trois enfants du même père, trois destins différents
1466. Ce que l'entraînement révèle sur les limites communes
66La même origine, des philosophies opposées
147Chapitre 19 — Diffusion vs GAN : pourquoi un challenger a détrôné le roi en trois ans
67BERT : l'intelligence qui lit dans les deux sens
1481. Le règne des GAN : une domination aussi brillante que fragile
68GPT : l'intelligence qui prédit la suite du monde
1492. L'irruption des modèles de diffusion : une idée venue d'ailleurs
69T5 : quand tout devient traduction de texte en texte
1503. Le duel technique : ce qui différencie vraiment les deux approches
70Trois destins industriels : qui a gagné quoi ?
1514. Pourquoi le timing a tout changé : le rôle des données, des GPU et de l'open source
71Ce que cette divergence nous apprend sur l'avenir des architectures
1525. Le verdict du terrain : ce que les professionnels ont réellement adopté
72📌 Résumé du chapitre
1536. Leçons durables : ce que ce basculement nous apprend sur l'évolution des architectures
73Partie 3 — Les LLM : quand la machine apprend à parler
154Chapitre 20 — L'avenir des architectures : multimodalité, agents autonomes et ce qui vient ensuite
74Chapitre 9 — Qu'est-ce qu'un grand modèle de langage ? Bien plus qu'un correcteur orthographique
155La multimodalité : quand la machine apprend à percevoir le monde entier
75La prédiction du mot suivant : une idée déceptive aux conséquences vertigineuses
156Les agents autonomes : de la réponse à l'action
76Ce que « grand » veut vraiment dire
157L'efficacité comme nouvelle frontière : faire plus avec moins
77De la langue au monde : comment un LLM construit une représentation de la réalité
158L'alignement et la robustesse : construire des architectures dignes de confiance
78Le fine-tuning et l'alignement : transformer un modèle brut en assistant utile
159Vers une IA incarnée : au-delà du texte et des pixels
79Ce que les LLM font vraiment quand ils « comprennent »
160Conclusion générale: Un immense MERCI !
80Les LLM dans la pratique : capacités réelles, usages transformateurs
161Lexique des termes clés: À propos de l'auteur
81Chapitre 10 — L'entraînement à l'échelle : des milliards de paramètres, des milliards de mots