← La Semaine IA
#6 · 27 mai 2026 · 7 min de lecture

Pour 1000 euros, une IA a réfuté un théorème ouvert depuis 80 ans. Une autre a prétendu écrire un OS. Un seul des deux est vrai.

Deux scoops à 1000 dollars sortis le même jour. OpenAI a vraiment fait tomber une conjecture de 1946. Google a vraiment lancé Doom — mais le mot 'écrit' fait beaucoup de travail. Sept minutes pour démêler les deux.

Illustration éditoriale — Pour 1000 euros, une IA a réfuté un théorème ouvert depuis 80 ans. Une autre a prétendu écrire un OS. Un seul des deux est vrai.

Cette semaine, deux annonces ont explosé les feeds tech avec exactement le même chiffre : moins de 1000 dollars.

OpenAI dit avoir cassé un problème de maths ouvert depuis 80 ans. Google dit avoir construit un système d’exploitation en 12 heures, qui fait tourner Doom en bonus. Même chiffre. Même semaine. Même titre LinkedIn.

Spoiler : la première histoire est vraie. La deuxième est largement gonflée.

Trois jours après la démo de Google, un chercheur de Princeton est passé derrière. Il a démonté ce que Google n’avait pas dit. Sept minutes pour comprendre laquelle des deux IA t’a vraiment menti.


À retenir en 3 puces tranchées :


I.Le gros truc — deux histoires à 1000 dollars. Un seul exploit réel.

Même chiffre. Même semaine. Une histoire vraie, une histoire gonflée. Et la presse tech a propagé les deux exactement pareil. La différence entre les deux dit tout sur ce qu’on va te vendre comme « agent IA » en 2026.

Commençons par le vrai exploit. 20 mai. OpenAI publie « An OpenAI model has disproved a central conjecture in discrete geometry »[1]. La question posée par Paul Erdős en 1946 : si tu dessines plein de points sur une feuille, combien peuvent être à exactement la même distance les uns des autres ?

Pendant 80 ans, personne n’avait su ni le démontrer, ni le démolir. L’analyse Latent Space[2] détaille la méthode : un modèle interne d’OpenAI a testé des milliers d’arrangements de points jusqu’à en trouver un qui contredit Erdős. Un « contre-exemple », c’est-à-dire la preuve que sa conjecture était fausse.

Coût total : sous les 1000 dollars.

On t’avait déjà parlé d’Erdős dans l’édition #2 et l’édition #3 — ChatGPT 5.4 démontrant des théorèmes, validé par Terence Tao. Cette fois, ce n’est plus une preuve. C’est l’inverse : la machine teste jusqu’à casser. Et la différence est plus profonde qu’elle n’en a l’air.

Ce que ça veut vraiment dire (et ce que ça ne veut pas dire)

L’IA n’a pas compris la conjecture. Elle a fait ce que les modèles font de mieux : tester très vite plein d’hypothèses qu’un humain mettrait des semaines à explorer. Neuf mathématiciens de premier plan — dont Tim Gowers, lauréat de la médaille Fields — ont ensuite validé à la main que le contre-exemple tient. La machine pour le calcul brutal. Les humains pour la preuve. Ce n’est pas une IA qui fait des maths à notre place. C’est un assistant de calcul à la vitesse d’une bibliothèque entière.

Maintenant l’histoire gonflée. 19 mai. Un post devient viral sur r/singularity : « Google’s Antigravity 2.0 creates an operating system from scratch using 93 agents in 12 hours for under $1K — and it runs Doom »[3].

On en parlait mardi dernier — Antigravity 2.0, c’est l’outil de développement IA sorti par DeepMind le 15 mai pour concurrencer Codex (cf. édition #5). La démo de cette semaine prétend l’utiliser pour bien plus que ça.

Les chiffres annoncés : 93 agents IA travaillent en parallèle pendant 12 heures. Ils produisent un OS qui démarre, qui organise des fichiers en dossiers, et qui — coup de marketing parfait — lance Doom. Le tout pour 916 dollars. Démo filmée en interne par DeepMind.

Le post a fait 14 000 upvotes en 24 heures. Et c’est là que ça déraille.

Coût bas ≠ valeur haute. La conjecture d’Erdős vaut un papier sérieux. L’OS Antigravity vaut une démo flashy. Même prix. Pas la même chose.

22 mai. Sayash Kapoor publie « Did Google’s AI agents really build an operating system for $916? »[4]. Kapoor est chercheur à Princeton et coauteur du livre AI Snake Oil (« la potion magique de l’IA »). Sa spécialité : démonter méthodiquement les annonces marketing des labos.

Son verdict tient en une phrase : le mot « OS » fait énormément de travail. Google n’a publié ni le code complet, ni les logs détaillés, ni une analyse de similarité avec le code Linux existant. Personne ne peut vérifier ce que les 93 agents ont vraiment créé de nouveau.

Et le « prompt initial » dont parle Google ? Plusieurs milliers de lignes d’instructions très précises. Pas exactement un humain qui dit « fais-moi un OS ».

Lecture qu’on assume

Ce que Google a vraiment montré : des agents qui orchestrent du code existant pendant 12 heures sans intervention humaine, et qui livrent quelque chose qui démarre. C’est déjà un exploit. Le marketing aurait dû s’en contenter. Au lieu de ça, Google a vendu « construit de zéro un OS ». Faux. Tu ne construis pas une maison parce que tu sais visser un meuble Ikea. Mais tu peux le vendre comme ça si personne ne vérifie.

0
analyses de similarité de code publiées par Google entre l’OS « écrit » par Antigravity 2.0 et le code Linux gratuit qui existait déjà.
Sans ça, impossible de savoir ce que les 93 agents ont créé.

Tu te demandes pourquoi je m’acharne sur ce détail ? Parce que la métrique a changé sous ton nez cette semaine.

Pendant trois ans, les labos se comparaient sur la performance. Qui répond le mieux à quelle question. En mai 2026, ils se comparent sur le coût. « Regarde ce qu’on fait pour 1000 dollars. » C’est devenu le nouveau pitch.

Sauf que coût bas ≠ valeur haute. La conjecture d’Erdős vaut un papier sérieux. L’OS Antigravity vaut une démo flashy. Même prix. Pas la même chose.

Une seule question filtre tout ça : qu’est-ce que l’IA a réellement produit de nouveau ? Pas le résultat final. La part de neuf, par rapport à ce qui existait déjà gratuitement.

Lundi matin, tu fais ça :
  1. Tu ouvres l’analyse de Sayash Kapoor pendant 5 minutes. Pas pour la lire en entier. Pour voir comment un chercheur sérieux décortique une annonce hype. C’est le geste à avoir avant de croire le prochain post LinkedIn « l’IA a fait X pour Y euros ».
  2. Dans la prochaine démo IA qu’on te pitche, tu poses cette question : « combien de lignes de code nouvelles ont été produites, et combien viennent de templates existants ? ». Ceux qui savent répondre, garde-les en contact. Les autres, tu sais.
  3. Tu envoies l’analyse Kapoor à ton DSI ou à ton chef d’équipe, avec en objet « à lire avant de signer le prochain pitch agent IA ». Trois minutes de lecture qui valent six mois d’évangélisation interne.

II.Trois signaux qui valent ta semaine

Trois autres trucs sont sortis cette semaine. Si tu rates les annonces fracassantes, c’est ces trois-là qui vont vraiment changer ton boulot dans 18 mois.

Signal 1 — Tous les labos d’IA sont devenus des « labos d’agents »

NEUF 23 mai. Shawn Wang (alias « swyx »), une voix qui compte dans le milieu dev IA, publie « All Model Labs are now Agent Labs »[5]. On t’avait dit dans l’édition #4 que « le sujet du printemps 2026 n’est plus quel LLM, mais quel agent ». Cette semaine, c’est validé noir sur blanc — par un des analystes les plus écoutés du milieu.

Sa thèse en une phrase : OpenAI, Anthropic, Google, Microsoft, Cohere et Apple ont tous publié dans la même fenêtre de 7 jours des annonces positionnées sur l’action, pas sur la conversation.

Concrètement : OpenAI sort Codex pour Virgin Atlantic et Ramp. Microsoft Research publie MagenticLite, MagenticBrain et Fara 1.5[6] — des agents qui tournent sur des modèles légers. Cohere annonce Command A+, son premier modèle « MoE » (Mixture of Experts : plusieurs petits cerveaux spécialisés au lieu d’un seul gros). Apple sort VSAS-Bench[7], un test pour les IA qui regardent et commentent une vidéo en direct.

Traduction pour ton lundi : d’ici 18 mois, Notion, Slack et Microsoft 365 ne te suggéreront plus des actions. Ils en feront. La vraie question 2027 dans les entretiens d’embauche sera : est-ce que tu signes pour qu’un agent envoie un mail sans que tu le relises ?

Signal 2 — Un outil open source jailbreake Llama en 10 minutes. Meta réplique par les avocats.

À SURVEILLER 21 mai. Le créateur de Heretic publie qu’il a reçu une mise en demeure de Meta[8]. Heretic est un outil open source qui « décensure » les modèles de langage — c’est-à-dire qui retire les garde-fous de sécurité censés empêcher l’IA de répondre à des questions sensibles.

25 mai. Le Financial Times publie son enquête[9]. Les chiffres : décensure de Llama 3.3 en moins de 10 minutes, sans matériel spécial. 13 millions de téléchargements de modèles « décensurés » depuis la sortie de Heretic l’an dernier.

Llama, c’est le grand modèle d’IA que Meta (Facebook) publie gratuitement, contrairement à OpenAI qui garde le sien sous clé. Le problème n’est pas l’outil. C’est que la sécurité d’un modèle open source ressemble à une porte de saloon. Meta investit des milliards pour la sécuriser. Un dev seul casse tout en un week-end.

La mise en demeure publique, elle, est nouvelle. On entre dans la phase juridique de la guerre open source. Si ta boîte télécharge des modèles open source pour les déployer en interne, prends l’habitude de vérifier qui a publié le fichier et sur quelle plateforme officielle. Les variantes « uncensored » se multiplient et n’ont pas la même responsabilité légale.

Signal 3 — DeepSeek lève 10 milliards et reste open source

À SURVEILLER 22 mai. Bloomberg rapporte[10] que DeepSeek finalise un tour de financement d’environ 10 milliards de dollars (70 milliards de yuans).

On t’avait pitché DeepSeek dès l’édition #1 — labo chinois open source, modèle équivalent GPT-4 entraîné pour 5,5 millions de dollars (les Américains équivalents coûtent des centaines de millions). Cette semaine, ils confirment : pas de pivot commercial à la OpenAI. 10 milliards de cash, tout reste open source. Là où OpenAI a basculé en mode commerce en mai (édition #3), Liang Wenfeng confirme l’inverse.

À côté, Alibaba prépare Qwen 3.7. ByteDance (la maison-mère de TikTok) publie Lance[11] — un modèle multimodal (qui comprend texte, image et vidéo dans une même fenêtre) léger au point de tourner sur une carte graphique de gamer, pas dans un data center.

D’ici fin 2027, la ligne « API IA » de ton budget logiciels sera divisée par deux. Pas parce qu’OpenAI devient gentil. Parce que trois labos chinois publient gratuitement ce qu’OpenAI fait payer.


III.Outil testé — MagenticLite (Microsoft Research) sur un cas réel

TESTÉ J’ai installé MagenticLite samedi soir sur ma machine perso. Verdict en deux lignes : fait en 11 minutes ce que je ferais en deux heures. Invente aussi un palier de prix qui n’existe pas. Les deux sont vrais en même temps.

Le test. Comparer Resend, Postmark et Mailgun — trois services d’envoi d’emails pour la newsletter.

Cas 1. L’agent va chercher les tarifs publics des trois. Il compare les SLA (le pourcentage de temps où le service est garanti d’être en ligne). Il lit même les pages de panne en temps réel. Tableau Markdown propre en 11 minutes. Je l’ai collé direct dans Notion. Cas 2. Je lui demande d’estimer mes coûts pour 7 abonnés (réel) et 5000 (hypothétique). Il sort des chiffres plausibles mais invente un palier Postmark qui n’existe pas. À ne PAS utiliser sans vérification pour du quantitatif fin.

L’usage que je garde. MagenticLite excelle pour débroussailler une décision technique en 10-15 minutes là où je passerais 2 heures. Il dérape quand il manque de données structurées et qu’il doit « interpréter » un pricing.

Le code est libre sur GitHub. Sur ma machine (carte graphique haut de gamme à 2000€), une question complexe coûte 8 centimes — l’électricité. Non-sponsorisé.


IV.Vrai ou faux ?

Affirmation qui circule sur LinkedIn et X depuis mardi : « L’IA vient de résoudre un problème de maths que personne n’avait résolu depuis 80 ans. Les chercheurs en maths sont remplacés. »

Vrai ou faux ?Mi-vrai. Complètement gonflé.

La première moitié est exacte. Un modèle d’OpenAI a réfuté la conjecture d’Erdős — donc trouvé un contre-exemple. Problème ouvert depuis 1946. Pour moins de 1000 dollars. Vraie percée.

La deuxième moitié est de l’extrapolation hype. Réfuter ≠ prouver.

Trouver un contre-exemple, c’est tester des configurations jusqu’à en casser une. Un ordinateur fait ça depuis 1970. La nouveauté en 2026 : la vitesse. Un modèle teste des milliers d’hypothèses par minute. Un humain, quelques dizaines par jour.

Mais démontrer un théorème — c’est-à-dire construire une preuve logique qui marche pour tous les cas possibles, pas juste ceux qu’on a testés — reste hors de portée des modèles actuels. Les neuf mathématiciens qui ont validé le contre-exemple cette semaine l’ont fait à la main. Sans eux, le résultat n’aurait pas été publié.

La machine teste mille hypothèses par minute. Le mathématicien en retient une qui vaut quelque chose. Devine lequel des deux est remplaçable.


V.La semaine prochaine

Cerebras — fabricant américain de puces spécialisées IA — finalise son entrée en Bourse. Valorisation pressentie : 60 milliards de dollars. Ça en ferait le 4e plus gros acteur derrière OpenAI, Anthropic (le créateur de Claude) et xAI (la boîte d’IA d’Elon Musk). Et surtout : ce serait le premier fabricant de puces dédiées IA à entrer en Bourse.

Petit aveu honnête : j’avais promis Cerebras comme sujet de cette édition dans le cliffhanger de l’édition #5. L’affaire OS-Doom était trop juteuse pour la rater. Donc Cerebras pour mercredi 3 juin, parole. C’est là que ça se joue, plus que dans les modèles.


À très vite,
Niss

Tu as aimé cette édition ? Forward à un collègue qui partage trop vite « l’IA va remplacer X ». Tu n’as pas aimé ? Réponds-moi en direct — chaque mail revient à mon inbox.


Références

  1. OpenAI, « An OpenAI model has disproved a central conjecture in discrete geometry » — 20 mai 2026.
  2. Latent Space, « [AINews] OpenAI GPT-next disproves 80 year old Erdős planar unit distance problem for under $1000 » — 21 mai 2026.
  3. r/singularity, « Google’s Antigravity 2.0 creates an operating system from scratch using 96 agents in 12 hours for under $1K in token costs — and it runs Doom » — 19 mai 2026.
  4. Sayash Kapoor (AI Snake Oil), « Did Google’s AI agents really build an operating system for $916? » — 22 mai 2026.
  5. Latent Space, « [AINews] All Model Labs are now Agent Labs » — 23 mai 2026.
  6. Microsoft Research, « MagenticLite, MagenticBrain, Fara 1.5: An agentic experience optimized for small models » — 21 mai 2026.
  7. Apple Machine Learning Research, « VSAS-Bench: Real-Time Evaluation of Visual Streaming Assistant Models » — 22 mai 2026.
  8. r/LocalLLaMA, « Heretic has been served a legal notice by Meta, Inc. » — 21 mai 2026.
  9. Financial Times via r/LocalLLaMA, « The Financial Times has published an article about Heretic » — 25 mai 2026.
  10. Bloomberg via r/LocalLLaMA, « DeepSeek is pushing forward with $10.29 billion financing round » — 22 mai 2026.
  11. Hugging Face, « bytedance-research/Lance — unified multimodal 3B model » — 19 mai 2026.