6Ce que vous allez découvrir
89Profondeur versus largeur : quel est le meilleur chemin vers l'intelligence ?
7Comment utiliser ce livre
90Ce que la profondeur a rendu possible : une révolution en chiffres
8Citations inspirantes
91📌 Résumé du chapitre
9Partie 1 — Le Cerveau Artificiel : Anatomie d'une Révolution Silencieuse
92Chapitre 12 — Les réseaux convolutifs : comment une machine apprend à voir
10Chapitre 1 — Le neurone qui voulait penser : aux origines d'une idée folle
93La vision comme problème mathématique : pourquoi les réseaux classiques ne suffisaient pas
111. Le cerveau comme machine à calculer : l'intuition fondatrice
94L'opération de convolution : voir en balayant
122. Le neurone biologique : ce que les chercheurs ont vraiment observé
95Couches de pooling, profondeur et hiérarchie des caractéristiques
133. Frank Rosenblatt et le Perceptron : la première machine qui "apprend"
96Architecture complète d'un CNN : des pixels au résultat final
144. Le premier hiver de l'IA : quand la réalité rattrape l'enthousiasme
97Applications concrètes : où les CNN ont transformé le monde réel
155. La renaissance : du neurone isolé aux réseaux profonds
98Les limites et l'évolution des réseaux convolutifs
166. Ce que l'histoire nous apprend sur ce que nous faisons aujourd'hui
99📌 Résumé du chapitre
17Chapitre 2 — Copier le cerveau humain… sans vraiment le comprendre
100Chapitre 13 — Les réseaux récurrents : quand la machine se souvient
18Section 1 — Le cerveau humain : une machine que la science n'a toujours pas percée
101Section 1 — La mémoire, ce problème que personne n'avait résolu
19Section 2 — Comment les pionniers ont tenté de "copier" ce qu'ils observaient
102Section 2 — L'anatomie d'un RNN : dérouler la boucle
20Section 3 — Les ressemblances réelles : ce que la métaphore capture correctement
103Section 3 — Le problème du gradient qui disparaît : la mémoire qui s'efface
21Section 4 — Les différences abyssales : ce que la métaphore dissimule
104Section 4 — LSTM et GRU : la mémoire apprivoisée
22Section 5 — La "boîte noire" : un problème hérité du biologique
105Section 5 — Les applications réelles des réseaux récurrents
23Section 6 — Pourquoi cette imitation imparfaite reste une réussite extraordinaire
106Section 6 — Les limites des RNN et le passage de témoin aux Transformers
24Chapitre 3 — L'architecture secrète : comment les couches se parlent entre elles
107📌 Résumé du chapitre
251. Qu'est-ce qu'une architecture neuronale ? La métaphore de l'usine
108Chapitre 14 — Les Transformers : l'architecture qui a tout changé
262. La propagation vers l'avant : comment l'information voyage
109Le problème que les Transformers sont venus résoudre
273. La connectivité entre les couches : tous reliés, mais pas n'importe comment
110L'encodeur et le décodeur : les deux piliers de l'architecture
284. Le flux de l'information : signaux, transformations et émergence
111Le mécanisme d'attention : voir tout en même temps
295. Architectures en pratique : des exemples qui révèlent les choix
112L'encodage positionnel : comment le Transformer sait que l'ordre compte
306. L'architecture comme hypothèse sur le monde
113Des mots aux géants : comment les Transformers ont évolué en quelques années
31📌 Résumé du chapitre
114Pourquoi les Transformers ont gagné : un bilan sans complaisance
32Chapitre 4 — Les poids synaptiques : la mémoire cachée de la machine
115Chapitre 15 — L'attention, c'est tout : le mécanisme qui propulse ChatGPT
33Section 1 — Le poids : un nombre qui porte le monde
1161. Le problème que l'attention devait résoudre
34Section 2 — Le biais : le poids que l'on oublie toujours de mentionner
1172. L'intuition fondamentale : regarder tous les mots en même temps
35Section 3 — Comment les poids encodent la connaissance : la magie du nombre
1183. Requêtes, clés et valeurs : la mécanique concrète de l'attention
36Section 4 — L'initialisation des poids : le premier pas dans l'inconnu
1194. L'attention multi-têtes : regarder sous plusieurs angles à la fois
37Section 5 — Régularisation et pruning : domestiquer les poids pour qu'ils restent honnêtes
1205. L'encodage positionnel : donner un sens à l'ordre des mots
38Section 6 — Le transfer learning : recycler des poids appris au lieu de tout réinventer
1216. De l'attention au Transformer complet : l'architecture qui a tout changé
39Chapitre 5 — Fonctions d'activation : le bouton ON/OFF qui change tout
1227. Les limites de l'attention et les frontières de la prochaine révolution
401. Le problème de la linéarité : pourquoi un réseau sans activation ne peut rien apprendre
123📌 Résumé du chapitre
412. La sigmoïde : la pionnière imparfaite
124Partie 4 — Entraîner un Modèle : La Cuisine Secrète de l'IA Moderne
423. ReLU : la révolution en une ligne
125Chapitre 16 — Construire un modèle de A à Z : ce que les tutoriels ne vous disent pas
434. Softmax : transformer des scores en probabilités
126Section 1 — Avant de coder : l'art de formuler le bon problème
445. La fonction tanh et la ménagerie des activations alternatives
127Section 2 — Les données : le territoire miné que personne ne cartographie vraiment
456. Choisir sa fonction d'activation : guide pratique et erreurs à éviter
128Section 3 — Architecture et choix techniques : pourquoi il n'existe pas de bonne réponse universelle
46Partie 2 — Apprendre Sans Comprendre : Le Paradoxe de l'Apprentissage Automatique
129Section 4 — L'entraînement réel : le chaos contrôlé que les courbes de perte ne montrent pas
47Chapitre 6 — Qu'est-ce qu'apprendre pour une machine ? (Spoiler : ce n'est pas ce que vous croyez)
130Section 5 — Évaluation et validation : la vérité que les chiffres peuvent masquer
481. Désapprendre ce que vous croyez savoir sur l'apprentissage
131Section 6 — Du modèle au déploiement : la dernière ligne droite que personne ne cartographie
492. La définition formelle : apprendre, c'est minimiser une erreur
132Chapitre 17 — Hyperparamètres : les curseurs invisibles qui font ou défont un modèle
503. Trois façons d'apprendre : supervisé, non supervisé, par renforcement
133La frontière entre paramètres et hyperparamètres : une distinction fondamentale
514. Ce que la machine mémorise vraiment : patterns, corrélations, et illusions de sens
134Le taux d'apprentissage : le réglage le plus crucial de tous
525. Le biais-variance : l'équilibre impossible au cœur de tout apprentissage
135Taille de batch, nombre d'époques, et la gestion du temps d'apprentissage
536. L'illusion de la généralisation : où l'apprentissage machine révèle ses vraies limites
136L'architecture du réseau comme hyperparamètre : profondeur, largeur et régularisation
54Chapitre 7 — La descente de gradient : tomber intelligemment vers la solution
137La recherche d'hyperparamètres : de la chance à la science
55Section 1 — Le problème avant la solution : qu'est-ce qu'on cherche à optimiser ?
138L'interdépendance des hyperparamètres : le danger des optimisations isolées
56Section 2 — L'intuition fondamentale : le randonneur aveugle dans la montagne
139Hyperparamètres dans les grands modèles : une nouvelle dimension du défi
57Section 3 — Le taux d'apprentissage : l'art de choisir la bonne taille de pas
140Chapitre 18 — GPU, TPU et puissance de calcul : l'IA est aussi une affaire d'électricité
58Section 4 — Les variantes modernes : gradient stochastique et mini-batchs
141Section 1 — Pourquoi un CPU ordinaire ne suffit pas : la physique du problème
59Section 5 — Les optimiseurs modernes : aller plus vite, plus intelligemment
142Section 2 — Le GPU : un accident de l'histoire devenu le moteur de l'IA
60Section 6 — Les pièges du paysage : minima locaux, plateaux et points-selles
143Section 3 — Les TPU : quand Google décide de tout reprendre à zéro
61Chapitre 8 — La rétropropagation : remonter le temps pour corriger ses erreurs
144Section 4 — Les data centers de l'IA : des cathédrales numériques voraces en énergie
62Section 1 — Pourquoi un réseau a besoin de se corriger : le problème de l'erreur distribuée
145Section 5 — La guerre des puces : géopolitique d'une ressource critique
63Section 2 — La propagation avant : construire pour mieux défaire
146Section 6 — Vers une IA plus sobre : l'impératif de l'efficience computationnelle
64Section 3 — La rétropropagation en détail : remonter l'erreur couche par couche
147Chapitre 19 — Les biais algorithmiques : quand la machine reproduit nos pires travers
65Section 4 — Le problème du gradient qui disparaît (et celui qui explose)
1481. Qu'est-ce qu'un biais algorithmique ? Derrière le mot, une réalité polymorphe
66Section 5 — Rétropropagation à travers le temps : quand les réseaux récurrents entrent en jeu
1492. Les données comme miroir brisé de la société
67Section 6 — Ce que la rétropropagation nous dit sur les limites de l'apprentissage
1503. Quand l'IA juge les humains : les domaines à haut risque
68Chapitre 9 — Overfitting : quand la machine apprend trop bien… et comprend trop peu
1514. La mécanique de l'amplification : pourquoi les modèles aggravent les inégalités
69Section 1 — L'élève surdoué qui échoue aux examens inédits
1525. Détecter et atténuer les biais : une boîte à outils imparfaite mais indispensable
70Section 2 — Les racines du problème : pourquoi la machine mémorise plutôt que comprendre
1536. Les enjeux politiques et sociétaux : au-delà de la technique
71Section 3 — Détecter l'overfitting : les signaux qui ne trompent pas
154Pour conclure : l'IA comme révélateur social
72Section 4 — Les remèdes : comment dompter la tendance à mémoriser
155Chapitre 20 — L'avenir des réseaux de neurones : entre promesses vertigineuses et limites réelles
73Section 5 — L'underfitting : l'autre extrême du spectre
156Section 1 — Les promesses en cours de réalisation : ce qui est déjà en train de changer
74Section 6 — Ce que l'overfitting nous révèle sur l'intelligence artificielle
157Section 2 — Les murs que personne ne veut regarder en face
75Chapitre 10 — Les données d'entraînement : le carburant que personne ne surveille assez
158Section 3 — Les fronts de recherche qui pourraient tout changer
761. La donnée, ce matériau invisible qui façonne tout
159Section 4 — La question de l'IA générale : mythe, horizon ou danger ?
772. Collecter les données : une tâche titanesque et rarement glamour
160Section 5 — Les enjeux de gouvernance : qui décide, qui contrôle, qui répond ?
783. La qualité des données : ce que les chiffres ne disent pas
161Section 6 — Ce que vous portez maintenant avec vous
794. Les biais dans les données : quand le passé emprisonne le futur
162📌 Résumé du chapitre
805. Le problème de la distribution : quand le monde réel diffère du monde d'entraînement
163Conclusion générale
816. Vers une hygiène des données : ce que chacun peut exiger
164Un immense MERCI !
82Partie 3 — Le Deep Learning : Quand la Profondeur Crée l'Intelligence
165Lexique des termes clés: À propos de l'auteur
83Chapitre 11 — Pourquoi "profond" ? La puissance insoupçonnée des couches multiples