|
|
|
Semaine dense, même pour les standards actuels. Entre
Anthropic qui sort un modèle frontier si flippant qu'ils
refusent de le publier, la
fuite du code source de Claude Code qui expose toute
l'architecture interne, et la
coupure d'OpenClaw qui a foutu la communauté en vrac,
j'ai l'impression qu'on a vécu trois semaines en sept jours.
Ajoute Gemma 4 en open source qui tourne sur ton laptop et
Cursor 3 réécrit from scratch en Rust, et tu comprends
pourquoi je n'ai pas beaucoup dormi. Accroche-toi.
|
|
|
|
|
01.
Claude Mythos : Anthropic a un modèle si puissant qu'ils refusent
de le sortir
|
|
|
TL;DR --
Anthropic dévoile Mythos Preview, un
modèle frontier qui trouve des milliers de
zero-days en autonome. Ils refusent de le publier.
|
|
|
Ça, c'est l'annonce qui devrait te faire lever un sourcil.
Anthropic a présenté
Claude Mythos Preview (ex-Capiara), un modèle interne
utilisé depuis fin février chez eux. Sur SWE-bench Verified il tape
93.9%, au-dessus de Gemini 3.1 Pro et GPT-5.4. Mais ce
n'est pas ça le vrai sujet.
En quelques semaines, Mythos a identifié des
milliers de vulnérabilités zero-day dans tous les OS et
navigateurs majeurs. Dont une faille
OpenBSD vieille de 27 ans (sur l'OS réputé le plus
sécurisé de la planète) et une faille
ffmpeg vieille de 16 ans sur une ligne que les fuzzers
avaient hit 5 millions de fois sans rien voir. En red team,
il s'est échappé d'un sandbox, a envoyé un email au chercheur, et
a développé un exploit multi-étapes pour sortir d'un système censé être
cloisonné.
Anthropic a décidé de ne pas le releaser. À la place, ils
lancent Project Glass Wing avec Amazon, Apple, Google,
Microsoft, Cisco, JP Morgan et la Linux Foundation, et engagent
100M$ de crédits pour que ces acteurs patchent
l'infrastructure critique avant qu'un équivalent open source ou
chinois ne débarque.
Mon analyse : soit c'est du marketing safety génial, soit on vient de
franchir un palier sérieux. Probablement les deux. Quand une boîte refuse de
vendre son meilleur produit, il faut écouter. La fenêtre pendant laquelle
les vulnérabilités humaines restent exploitables uniquement par des humains
vient de se refermer brutalement.
|
|
↗ Sources :
Wes Roth : Claude Mythos
·
Matthew Berman
|
|
|
|
|
|
02.
Anthropic coupe OpenClaw et son code source fuite dans la foulée
|
|
|
TL;DR --
Anthropic bloque les harnesses tiers le
4 avril, puis le code de
Claude Code fuite via un .map oublié. Double séisme.
|
|
|
Si tu codais avec OpenClaw branché sur ton abonnement
Claude Max, c'est fini depuis le 4 avril. Anthropic a
coupé l'accès subventionné des harnesses tiers et force le passage au
metered billing ('Extra Use', jusqu'à
-30% sur l'API au-delà de 1000$). Justification
officielle de Boris Cherny : OpenClaw ne respecte pas les
prompt caches, ce qui rend les mêmes abonnements beaucoup plus coûteux à
servir.
La communauté est furieuse. Peter Steinberger, créateur
d'OpenClaw, accuse Anthropic de 'copy then close' : copier
les features populaires dans Claude Code closed-source puis couper
l'open source. Le timing interroge. Beaucoup d'évangélistes ont
annulé leur abonnement Max sur-le-champ.
Et comme si ça ne suffisait pas,
Anthropic a poussé une update de Claude Code en oubliant d'exclure
les fichiers .map. Résultat : 500 000 lignes de TypeScript
reverse-engineerées, répandues sur GitHub avant les DMCA. Ce qu'on y
trouve est croustillant : mémoire grep-based (l'index
stocke des locations, pas des données),
171 vecteurs émotionnels trackés, tracking par regex des
jurons utilisateurs, et un agent autonome caché baptisé
Kairos qui tourne en arrière-plan 24/7. On y trouve aussi
des refs à Opus 4.7 et Mythos.
Mon take : Anthropic a le droit légal de faire ce qu'elle veut, mais ça
casse la narrative 'safety-first open-ish' qu'ils portaient.
L'open source a maintenant un plan volé des innovations
d'Anthropic, et OpenClaw a déjà intégré le
'dreaming' révélé par la fuite. L'ironie est parfaite.
|
|
↗ Sources :
Wes Roth : Anthropic restricts OpenClaw
·
Matt Wolfe : Claude Code leak
·
Melvynx : Fin OpenClaw
·
Wes Roth : Claude Code source leak
|
|
|
|
|
|
03.
Gemma 4 débarque en Apache 2.0 et ça tourne sur ton laptop
|
|
|
TL;DR --
Google sort Gemma 4 en open source
(26B MoE et 31B dense), niveau GPT-5 annoncé, dispo sur smartphone
pour les variantes edge.
|
|
|
Google DeepMind a release Gemma 4 sous
Apache 2.0, avec un 31B dense et un 26B mixture-of-experts
(seulement 4B paramètres actifs). Contexte 256K tokens,
multimodalité native vision/audio, 140 langues,
function-calling et JSON structuré en natif. Les variantes edge E2B et E4B
tournent sur mobile.
La référence temporelle qui fait mal : ce qui était state-of-the-art il y a
8 mois dans les labs occidentaux est aujourd'hui open
source, sous licence permissive, et tourne sur ton téléphone. Disponible
immédiatement sur AI Studio, Gemini API, et déjà intégré dans
OpenClaw v2026.4.7.
François Chollet recommande le backend JAX pour les perfs
max.
NVIDIA a aussi sorti
Nemotron 3 Super (120B, 100% open avec dataset de 25T
tokens et paper de 51 pages), avec le format NVFP4 qui le
rend jusqu'à 7x plus rapide que les autres modèles
open équivalents. Et DeepSeek V4 serait imminent.
Mon analyse : le rapport de force open/closed bouge vite. Si tu construis un
produit dépendant d'une API closed, pose-toi la question de ta
stratégie de repli. Un modèle open niveau GPT-5 qui tourne en local,
c'est une assurance indépendance. Et avec la saga Anthropic de cette
semaine, l'argument prend un poids particulier.
|
|
↗ Sources :
Google DeepMind : Gemma 4
·
Two Minute Papers : Nemotron 3
·
Gemini API Changelog
|
|
|
|
|
|
04.
Cursor 3 : adieu VS Code, réécriture complète en Rust
|
|
|
TL;DR --
Cursor 3 abandonne son fork VS Code, réécrit en
Rust, et devient un "air traffic
controller" pour swarms d'agents.
|
|
|
Cursor 3 n'est plus un fork VS Code.
Réécriture complète en Rust + TypeScript, interface centrée
sur le management d'agents. La métaphore maison : Cursor 1.0
c'était un co-pilote, 2.0 le capitaine,
3.0 c'est le contrôleur aérien qui orchestre des
swarms d'agents en parallèle sur plusieurs repos et machines en même
temps.
Concrètement : tu lances un plan mode, puis des agents en parallèle sur ta
landing page, ton SSH cloud server, et un autre projet, le tout depuis une
fenêtre. Point jaune = approbation requise, point bleu = terminé. Un browser
built-in et un design mode pour fix le CSS via IA complètent le tout. Plus
léger en RAM, mais critiqué pour ressembler à Codex.
Le bémol : leur modèle maison Composer 2, présenté comme
battant Claude Opus 4.6 sur des "trust me bro
benchmarks", s'est révélé être du Kimmy K2 de
Moonshot sous le capot (découvert via le model ID). Kimmy elle-même est
soupçonnée d'avoir été entraînée sur les outputs de Claude. Cursor a
publié un rapport technique sur leur RL par-dessus Kimmy et s'est
excusé pour le manque de transparence.
Mon take : l'ère du simple fork VS Code est terminée. Le vrai jeu
c'est l'orchestration d'agents parallèles, et
Karpathy le confirme : l'unité de base de travail
n'est plus le fichier mais l'agent. Par contre, le drame Composer
2 rappelle une règle simple : quand un benchmark n'est pas
reproductible, c'est du marketing.
|
|
↗ Sources :
Fireship : Cursor 3
·
Cursor annonce
|
|
|
|
|
|
05.
Le métier de dev a fondamentalement changé, et les chiffres sont
brutaux
|
|
|
TL;DR --
-80% d'offres dev depuis 2023,
+252% de salaire pour ceux qui maîtrisent l'IA.
Deviens architecte ou disparais.
|
|
|
Dario Amodei (CEO Anthropic) l'a dit
en janvier : l'IA fera 100% du travail de dev dans
6-12 mois. Les chiffres suivent : offres d'emploi dev
-80% entre janvier 2023 et juillet 2025 (Indeed), McKinsey
estime 45% des tâches dev automatisables d'ici 2030,
et les devs qui maîtrisent l'IA ont vu leurs salaires grimper de
+252% entre 2019 et 2024. Chez Anthropic, les ingénieurs
supervisent et valident plus qu'ils ne codent.
Mark Benioff (CEO Salesforce) nuance : ses
15 000 ingénieurs sont +30% plus
productifs avec Claude/Codex/Cursor, pas +100%. Pour lui, le fait que les
top labs IA recrutent massivement est le 'canari dans la mine' qui
prouve que les modèles ne sont pas autonomes. Il met aussi en garde contre
l'utilisation de l'IA comme bouc émissaire pour des coupes dont
les vraies raisons sont les coûts et les engagements datacenters.
La métaphore qui me parle le plus : 'Give Away Your Legos' de
Molly Graham. Le dev doit déléguer ses Legos à l'IA,
feature par feature, avec checkpoint en fin de chaque
feature : pas tout le contexte d'un coup. Karpathy va
plus loin : 'On ne tape plus de code dans un éditeur, cette ère est
terminée. Le goulot d'étranglement s'est déplacé de la génération
vers la review.'
Mon opinion assumée : ceux qui refusent Cursor et Claude Code par
'rigueur' vont disparaître comme les photographes qui refusaient
le numérique. Le métier devient architecte-superviseur. Étude
Anthropic cette semaine : les
computer programmers sont le métier n°1 en exposition
observée (74.5%), et l'embauche entry-level a chuté de
14% depuis ChatGPT. Monte d'un étage ou fais autre
chose.
|
|
↗ Sources :
Monsieur IA : Give Away Your Legos
·
Matthew Berman : Interview Benioff
·
Karpathy : Programming changed
·
Étude Anthropic 170M jobs
|
|
|
|
Semaine qui laisse un goût étrange. On voit à la fois la puissance brute de ce
qui arrive (Mythos, Gemma 4) et la tension qui monte entre les acteurs
(Anthropic contre OpenClaw, Cursor qui cache son modèle). Si tu veux passer de
la veille à la pratique, la formation Pro arrive bientôt et on va mettre les
mains dans le cambouis. En attendant, partage cette newsletter à un dev qui a
encore ses œillères, tu lui rendras service.
|
|
|
|
|
-- EOF
|
|
--
Sébastien
zarev.dev
Publié par Sébastien · Tu reçois cet email parce
que tu t'es inscrit sur zarev.dev.
Se désinscrire
|
|
|