#7 · 4 juin 2026 · 7 min de lecture

Oui, Cerebras est plus rapide que Nvidia. C'est la seule chose simple dans la plus grosse IPO de l'année.

Une puce de la taille d'une assiette a fait +108 % le jour de son entrée en Bourse. Puis le marché a lu le prospectus : 86 % du chiffre d'affaires vient de deux entités d'Abu Dhabi, le 'bénéfice' 2025 est un trucage comptable, et son premier client lui a prêté un milliard pour acheter 10 % d'elle-même. Sept minutes pour comprendre le deal le plus bizarre de l'année IA.

Je t’avais promis Cerebras dans l’édition précédente. Le voilà — et il valait l’attente, parce que l’histoire est bien plus tordue que « une nouvelle puce IA ».

Le 14 mai, Cerebras est entré en Bourse au Nasdaq. Au premier jour, l’action a grimpé jusqu’à +108 %. La plus grosse IPO tech de 2026 : 5,55 milliards de dollars levés. Sur LinkedIn, le récit était simple — « la puce qui va tuer Nvidia ». Puis quelques personnes ont fait un truc rare : elles ont lu le prospectus.

Et le prospectus, lui, ne raconte pas du tout la même histoire que les posts LinkedIn.

À retenir en 3 puces tranchées :

La vitesse, elle, est réelle. Cerebras fabrique une puce de la taille d’une assiette (au lieu de découper le silicium en dizaines de petites puces comme Nvidia). Sur certains modèles, elle crache le texte 6 à 20 fois plus vite que les puces Nvidia habituelles (les fameux « GPU ») qu’on loue à distance^[5]. Pour les agents IA qui « réfléchissent à voix haute », ce temps d’attente raccourci change tout. Ça, c’est vendable, et c’est vrai.
L’argent, lui, est un casse-tête. 86 % du chiffre d’affaires 2025 vient de deux entités liées d’Abu Dhabi^[2]. Le « bénéfice » de 238 millions affiché est en réalité une perte, une fois retiré un gain comptable exceptionnel. Et l’action se paie 130 à 190 fois ce que la boîte gagne chaque année, là où Nvidia se paie 26 fois — plus le chiffre est haut, plus le pari est risqué. Personne ne dit ça dans les posts triomphants.
Le détail qui résume l’année IA : OpenAI a prêté un milliard à Cerebras^[6] — en échange d’une option pour racheter ~10 % de la société. Son premier client est aussi son banquier et son actionnaire. On t’explique en Section I pourquoi c’est vertigineux.

I.Le gros truc — La puce est réelle. Le modèle économique est un manège.

Deux histoires cohabitent dans cette IPO. Une histoire d’ingénierie, solide. Une histoire d’argent, vertigineuse. La presse tech a relayé la première et zappé la seconde. Or c’est la seconde qui te dit ce qu’on va te vendre comme « révolution de l’inférence » en 2026 — l’inférence, c’est le moment où l’IA te répond, par opposition à son long entraînement initial.

Commençons par ce qui est vrai. Cerebras a fait un vrai pari d’ingénieur. Un processeur IA classique — un « GPU » signé Nvidia — c’est une petite puce taillée dans une galette de silicium. On en aligne ensuite des milliers pour faire tourner un système. Cerebras a fait l’inverse : garder la galette entière. Une seule puce géante, grande comme une assiette à dessert, qui embarque 900 000 cœurs de calcul là où une puce Nvidia haut de gamme en compte quelques dizaines de milliers^[4].

L’intérêt : tout se passe sur une seule puce, donc l’information circule sans bouchon. Résultat mesuré par Artificial Analysis, un évaluateur indépendant, le 6 mai : sur un gros modèle (Kimi K2.6), Cerebras sort 981 « mots-machine » par seconde, soit près de 7 fois plus vite que le meilleur concurrent dans le cloud^[5]. Un mot-machine, c’est un petit bout de mot : l’unité dont l’IA débite ses réponses. Pour toi, ça veut dire quoi ? Que la réponse d’une IA n’apparaît plus mot après mot — elle surgit d’un coup. Et pour un agent qui enchaîne dix étapes de raisonnement, multiplier la vitesse par 7 transforme l’expérience.

On t’avait dit en l’édition #6 que tous les labos étaient devenus des « labos d’agents ». Cerebras est le pari matériel de ce virage : si l’avenir, ce sont des agents qui pensent vite, alors la vitesse n’est plus un luxe, c’est le terrain de jeu. Et sur ce terrain, Cerebras arrive avant Nvidia.

Ce que la vitesse cache (et que SemiAnalysis a pointé)

L’avantage de Cerebras s’effondre dès que beaucoup d’utilisateurs tapent en même temps. Sa puce n’a que 44 Go de mémoire ultra-rapide (contre 288 Go dans un module Nvidia récent). Elle excelle pour un utilisateur sur un modèle de taille moyenne — pas pour servir des millions de requêtes en parallèle, ni les modèles géants (1 000 milliards de paramètres) sans bricolage multi-puces^[3]. Traduction : Cerebras est une Formule 1. Imbattable sur un tour lancé. Mais tu ne déménages pas une ville avec des Formule 1.

Maintenant, l’histoire d’argent. 13 mai au soir. Le prix de l’action est fixé à 185 dollars. Le lendemain, elle ouvre à 350, grimpe jusqu’à 385 en séance (+108 % sur le prix d’introduction), puis retombe à 311 en clôture — toujours +68 % en une seule journée. Andrew Feldman, le PDG, devient milliardaire avant le déjeuner^[1]. Et puis trois chiffres, planqués dans le prospectus déposé au gendarme de la Bourse américaine (la SEC), viennent gâcher la fête.

86 %

du chiffre d’affaires 2025 de Cerebras provient de deux entités d’Abu Dhabi : G42 (un géant tech émirati) et MBZUAI (l’université d’IA du pays). Si l’un des deux éternue, le « leader de l’inférence » s’enrhume.

Deux clients, un seul pays, zéro filet.

Chiffre 1 — la dépendance. Un fournisseur informatique normal a des centaines de clients. Cerebras en a essentiellement deux, et ils sont dans le même pays^[2]. Pire : la première tentative d’IPO, en 2024, avait été bloquée par l’autorité américaine de sécurité nationale (le CFIUS), à cause des liens d’un de ces clients, G42, avec le chinois Huawei (que Washington traite comme une menace). Le risque géopolitique n’est pas un détail. Il est dans la première ligne du business.

Chiffre 2 — le faux bénéfice. Cerebras affiche 238 millions de dollars de profit en 2025. Magnifique, pour une boîte de cette taille. Sauf que ce chiffre inclut un gain comptable exceptionnel de 363 millions, lié à des manœuvres financières et non à des ventes — de l’argent « sur le papier », pas du cash encaissé. Une fois retiré, l’entreprise est en perte : plus de 145 millions partis dans son activité normale^[2]. Le « profit » était un maquillage parfaitement légal, et parfaitement trompeur.

Quand un fournisseur et son client se prêtent de l’argent en rond, ce n’est plus un marché. C’est un manège qui se gonfle tout seul, et tout le monde paie le ticket plus tard.

Chiffre 3 — le manège OpenAI. C’est le plus fou. En décembre 2025, OpenAI obtient une option : le droit de racheter plus tard environ 10 % de Cerebras à un prix fixé d’avance^[6]. En janvier 2026, il lui prête un milliard de dollars. Et dans la foulée, un accord-cadre dépassant 20 milliards lui réserve la puissance de calcul de… Cerebras. Récapitule : OpenAI paie Cerebras pour du calcul, OpenAI a prêté à Cerebras de quoi grandir, et OpenAI possède une part de Cerebras. Client, banquier, actionnaire. Les trois.

Pourquoi je reviens là-dessus plutôt que sur la vitesse ? Parce que c’est la signature de la bulle IA de 2026. On en voyait déjà les prémices quand OpenAI a basculé en mode commerce (édition #3). Aujourd’hui, les géants ne se contentent plus d’acheter : ils financent leurs propres fournisseurs, qui leur revendent du service, ce qui gonfle la valeur de tout le monde. Tant que la musique joue, chacun s’enrichit sur le papier. La question n’est pas si la musique s’arrête. C’est qui tient encore une chaise.

Lundi matin, tu fais ça :

La prochaine fois qu’on te vend une « licorne IA », exige un seul chiffre : « combien de clients pèsent plus de 10 % du chiffre d’affaires ? ». Au-dessus de deux clients à 40 %, ce n’est pas une entreprise, c’est un contrat déguisé en entreprise.
Apprends à repérer le faux bénéfice. Dans tout communiqué de résultats, cherche « gain exceptionnel », « non récurrent », « one-time ». C’est là qu’on cache la perte. Trois mots qui valent un diplôme de finance.
Teste la vraie promesse, gratuitement. Cerebras offre 1 million de mots-machine par jour sur son API (voir la Section III). Si tu construis le moindre agent, branche-le une heure et juge la vitesse par toi-même, sans croire personne.

II.Trois signaux qui valent ta semaine

Pendant que Cerebras occupait les feeds, trois autres choses ont bougé. Ce sont elles qui vont vraiment toucher ton travail dans 18 mois.

Signal 1 — Anthropic dépose en douce pour entrer en Bourse, à 965 milliards — et attaque le Pentagone

NEUF 1er juin. Anthropic (le créateur de Claude) a déposé un dossier d’introduction en Bourse confidentiel auprès de la SEC, sur une valorisation de 965 milliards de dollars^[7] — dépassant pour la première fois OpenAI. Son chiffre d’affaires ramené sur un an serait passé d’environ 4 milliards il y a un an à plus de 50 milliards visés cet été — une croissance qu’aucune entreprise logicielle n’avait jamais montrée.

Le twist : au même moment, Anthropic est en procès contre le Pentagone^[8]. Le ministère américain de la Défense a classé l’entreprise « risque pour la chaîne d’approvisionnement » — un statut d’ordinaire réservé aux adversaires étrangers — parce qu’Anthropic refusait de donner un accès illimité à Claude « pour tous les usages licites ». Des clients entreprises ont appelé, inquiets pour leurs contrats. La leçon pour ton produit : si tu intègres une IA dans une offre B2B, la réputation et les choix éthiques de ton fournisseur font désormais partie de ta due diligence. On t’avait dit en l’édition #4 que la régulation deviendrait un argument commercial. La voilà devenue un risque commercial.

Signal 2 — Google a transformé son moteur de recherche en exécuteur d’agents

À SURVEILLER 19 mai. À sa conférence I/O, Google annonce que son « AI Mode » (le moteur de recherche qui répond au lieu de lister des liens) a atteint 1 milliard d’utilisateurs mensuels en un an^[9]. Et il ajoute deux fonctions : des « agents d’information » qui surveillent un sujet 24h/24 pour toi, et un système qui appelle directement des prestataires (réparateur, salon) à ta place.

Ce n’est plus « chercher ». C’est « déléguer ». Pour toi qui fais du produit ou du marketing : si ton trafic dépend de Google, le modèle « je réponds à l’utilisateur sans l’envoyer chez toi » s’applique maintenant à un milliard de personnes. Le référencement tel qu’on le connaît a un compte à rebours.

Signal 3 — La guerre des éditeurs de code vire au carnage, et Microsoft se prend les pieds dedans

À SURVEILLER 1er juin. GitHub Copilot — l’assistant de code de Microsoft, longtemps leader — passe à une facturation à l’usage. Des développeurs voient leur abonnement bondir de 29 $ à plusieurs centaines de dollars par mois^[10]. Le post d’annonce officiel récolte 904 votes négatifs contre 22 positifs. Pendant ce temps, le concurrent Cursor (un autre assistant de code) a atteint 2 milliards de chiffre d’affaires annuel^[11] — la croissance la plus rapide de l’histoire du logiciel d’entreprise.

Microsoft a bien sorti son propre modèle de code maison la même semaine (MAI-Code-1-Flash, plutôt bon sur les tests). Mais augmenter ses prix le jour où le concurrent explose, c’est le manuel parfait du leader qui rate un virage. Si tu gères une équipe de devs sur Copilot, ta facture de juin a peut-être triplé sans préavis. C’est le moment de tester Cursor ou Claude Code — pas dans six mois. Microsoft a inventé la facture surprise au moment précis où son concurrent offrait la sortie.

III.Outil testé — L’API gratuite de Cerebras dans une boucle d’agent

TESTÉ J’ai branché l’API de Cerebras — le service par lequel un développeur connecte son logiciel à leur puce — dans un petit agent maison (offre gratuite : 1 million de mots-machine par jour). Verdict en deux lignes : la vitesse est bluffante pour un usage solo. Inutile de rêver pour de la production à fort trafic.

Le test. Un agent qui lit un brief, raisonne en plusieurs étapes, et rédige une réponse au fil de l’eau, mot après mot. Sur un modèle léger (Llama 4 Scout), l’API tourne à environ 2 600 mots-machine par seconde^[12]. Concrètement : la réflexion de l’agent, qui prenait 8 secondes affichées mot à mot avec un fournisseur classique, devient quasi instantanée. Pour une démo client ou un outil perso, ça change la sensation du produit du tout au tout.

La limite. Le million de mots-machine quotidien part vite dès qu’on enchaîne les boucles d’agent. Et la vitesse chute si plusieurs personnes tapent en même temps — exactement le défaut pointé plus haut. L’usage que je garde : prototyper et démontrer des agents où la latence se voit. Pour servir des milliers d’utilisateurs, je reste sur du GPU classique. Gratuit, non sponsorisé.

IV.Vrai ou faux ?

Affirmation qui circule sur LinkedIn depuis l’IPO : « Cerebras est 20 fois plus rapide que Nvidia. Les GPU sont morts pour l’inférence IA. »

Vrai ou faux ? — Vrai dans un coin. Faux en général.

Le « 20 fois » vient d’une mesure réelle, mais dans un cas très précis : un seul utilisateur, un modèle de taille moyenne, une mesure de latence du premier mot à l’écran. Dans ce coin-là, oui, Cerebras humilie le GPU, et c’est mesuré par un tiers indépendant^[5].

Mais « les GPU sont morts » est faux. Dès qu’il faut traiter des millions de requêtes en parallèle (le quotidien d’un gros service), Nvidia reprend l’avantage grâce à sa mémoire bien plus grande. Et Cerebras ne peut pas faire tourner seul les modèles géants sans assembler plusieurs puces — ce qui annule une partie de son intérêt^[3].

La vérité tient en une image : Cerebras a construit la voiture la plus rapide du monde sur un tour. Nvidia possède l’autoroute, les camions, et la logistique. Les deux peuvent gagner de l’argent. Un seul des deux fait tourner la planète aujourd’hui.

V.La semaine prochaine

Tout le monde se vend des chaises dans la même salle. OpenAI, Anthropic, Cerebras, xAI — chacun se finance en cercle, achète chez ceux qui achètent chez lui, et se valorise sur les promesses des autres. La semaine prochaine, on tire ce fil jusqu’au bout : « financement circulaire » — est-ce du génie financier ou la prochaine bulle qui éclate ? On regardera qui a déjà vu ce film (spoiler : la bulle internet et télécom qui a explosé en 2000), et quels signaux concrets te diraient, à toi, que le château de cartes commence à se fissurer. C’est le sujet le moins glamour et le plus important de l’année.

À très vite,
Niss

Tu as aimé cette édition ? Forward-la à un collègue qui s’apprête à investir, recruter ou signer sur la foi d’un post LinkedIn triomphant. Tu n’as pas aimé ? Réponds-moi en direct — chaque mail revient à mon inbox.

Références

TechCrunch, « Cerebras raises $5.5B, kicking off 2026’s IPO season with a bang » — 14 mai 2026.
TechTimes, analyse du prospectus S-1 Cerebras (86 % de revenus dépendants d’entités émiraties) — 15 mai 2026.
SemiAnalysis, « Cerebras: Faster Tokens Please » (analyse technique critique : limites mémoire et batch) — 2026.
SEC, prospectus S-1 Cerebras Systems (architecture WSE-3, finances) — avril 2026.
VentureBeat, benchmark indépendant Artificial Analysis sur Kimi K2.6 (981 tokens/s, ~7× le cloud GPU) — mai 2026.
TechCrunch, « OpenAI’s cozy partner Cerebras is on track for a blockbuster IPO » (prêt d’1 Md$, warrants, contrat 20 Md$) — 4 mai 2026.
Fortune, « Anthropic confidentially files for IPO at $965 billion valuation » — 1er juin 2026.
Axios, « Anthropic sues Pentagon over supply-chain risk label » — 9 mars 2026.
Google, blog officiel Search I/O 2026 (AI Mode 1 Md d’utilisateurs, agents d’information, agentic calling) — 19 mai 2026.
TechCrunch, « GitHub Copilot’s new token-based billing spurs consternation among devs » — 30 mai 2026.
TechCrunch, « Cursor in talks to raise $2B at $50B valuation » + Microsoft MAI-Code-1-Flash (Build 2026) — avril-juin 2026.
Cerebras Inference, documentation API (tier gratuit 1 M tokens/jour, benchmarks Llama 4 Scout) — 2026.