Geen nieuw model. Vijf orchestratiefeatures. En een zaal vol engineers die hun hand opstak toen werd gevraagd wie die week een pull request had geshipt die volledig door AI was geschreven.

Het belangrijkste evenement van de afgelopen week was Anthropics Code with Claude-conferentie in Londen (19–21 mei), de tweede stop na San Francisco op 6 mei en de laatste vóór Tokio in juni. Er werd geen nieuw model aangekondigd — en dat was, zo maakten de engineers op het podium duidelijk, juist het punt. Het verhaal van 2026 gaat niet meer over het opschalen van parameters. Het gaat over wat er gebeurt als je een capabel model in een lus op zichzelf laat lopen, en welke scaffolding je nodig hebt om dat veilig en productief te maken. Hier is wat opviel uit de mond van de Anthropic-engineers zelf.


i. De kernverschuiving: Claude prompt zichzelf

Boris Cherny, hoofd van Claude Code, opende de keynote door te herdefiniëren wat werken met Claude eigenlijk betekent. Het nieuwe uitgangspunt is volgens hem niet langer dat jij Claude prompt — het is dat Claude zichzelf prompt. Zelf-verificatie en zelf-correctie zijn geen optionele features meer; ze zijn de architectuur. In plaats van code te genereren en mensen de fouten te laten opruimen, wordt van het model verwacht dat het in zijn eigen lus test en bijstuurt totdat dingen daadwerkelijk draaien.

Voor builders is dit meer dan een UX-verandering. Het herbedraadt hoe je over je eigen rol nadenkt: minder “stuur het model beurt voor beurt aan”, meer “stel een doel en review het traject.” Cherny is hier consistent in geweest — eerder dit jaar merkte hij op X op dat in de voorgaande dertig dagen elk van zijn bijdragen aan de Claude Code-codebase door Claude Code zelf was geschreven. Zijn al langer staande advies aan founders, deze week opnieuw herhaald op de Lightcone-podcast: bouw voor het model van over zes maanden, niet voor het model dat nu voor je staat.


ii. “Let it cook” — Ravi Trivedi en Dreaming

Ravi Trivedi, een andere Anthropic-engineer, vatte het principe samen in twee woorden.

Let it cook. — Ravi Trivedi, Anthropic

Ga uit Claude’s weg. De feature die hij demonstreerde om dit te onderbouwen heet Dreaming — een nieuwe capability in Claude Code waarbij agents notities aan zichzelf schrijven tussen taken in, en observaties, valkuilen en bruikbare patronen uit één run bewaren die de volgende run informeren.

Voor iedereen die long-horizon agents draait — nachtelijke exception-onderzoeken, geautomatiseerde CI-fixes, multi-repo refactors — verandert Dreaming de rekensom. De agent begint niet meer elke sessie koud. Hij stapelt geleefde ervaring op binnen jouw codebase.


iii. Hoeveel code wordt nu door Claude geschreven?

Jeremy Hadfield, een Anthropic-engineer die in Londen sprak, opende een van zijn talks met de vraag hoeveel mensen in de zaal die week een pull request hadden geshipt die volledig door Claude was geschreven. Ongeveer de helft van het publiek — laptops open op hun knieën — stak hun hand op. Zijn vervolg, aldus de berichtgeving van MIT Technology Review: het merendeel van Anthropics eigen software is inmiddels Claude-geschreven.

Dit is het type claim dat je makkelijk als marketing afdoet, totdat je je realiseert dat Anthropic zelf een niet-triviale hoeveelheid productiecode op Claude Code shipt, en dat de mensen die dit zeggen degenen zijn die de PR’s schrijven — of niet meer schrijven.


iv. De eindstaat, volgens Anthropic

Gevraagd naar waar dit allemaal heen gaat, formuleerde een Anthropic-engineer met de naam Jiang het doel onomwonden: de eindstaat die Anthropic probeert te bereiken is er één waarin Claude zichzelf kan bouwen. Catherine Wu, ook op het podium, voegde de nodige nuance toe dat expert engineers nog altijd nodig zijn om systemen te ontwerpen en lastiger problemen te troubleshooten — maar dat Claude in de loop van de tijd ook daarin beter wordt.

Klinkt dat agressief, bedenk dan dat dit hetzelfde bedrijf is waarvan Chief Product Officer Ami Vora twee weken eerder het San Francisco-evenement opende, en waarvan engineers de “over zes maanden”-framing al jaren uitdragen.


v. De vijf features die San Francisco bepaalden — en terugkwamen in Londen

Code with Claude SF op 6 mei sloeg bewust een modellancering over en shipte in plaats daarvan vijf orchestratiefeatures. Ze kwamen herhaaldelijk terug in de Londense sessies:

  • Dreaming. Agents nemen persistente notities tussen runs (hierboven behandeld).
  • Outcomes. Developers definiëren een rubric voor goede output; een aparte grader evalueert elk resultaat in zijn eigen context window en stuurt de agent terug om te herzien totdat de lat gehaald wordt. Anthropics interne benchmarks laten zien dat task success op de moeilijkste problemen tot 10 punten omhooggaat.
  • Multi-agent orchestratie. Echte coördinatie tussen agents — de taak van de mens is om het doel te definiëren en de output te reviewen, niet om de code te schrijven.
  • Webhooks. Als je eenmaal een outcome hebt gedefinieerd, laat de agent draaien; krijg een melding wanneer hij klaar is.
  • Claude Finance. Tien voorgebakken agents voor financial workflows, plus Add-ins voor Excel en vergelijkbare oppervlakken.

Voor MCP-zware workflows is Outcomes misschien wel de meest onderschatte van de vijf. Een grader die in zijn eigen context window draait is precies het patroon dat de lus sluit op agents die een taak “bijna” afmaken.


vi. Developer Platform-updates om te weten

Een aantal platformveranderingen landden parallel aan de conferentie en zijn vooral relevant als je MCP-servers bouwt of Claude Code op schaal draait.

  • MCP tunnels in Research Preview — handig voor lokale MCP-servers die je beschikbaar wilt maken voor remote Claude-sessies zonder te redeployen.
  • Self-hosted sandboxes voor Claude Managed Agents — adresseert eindelijk de data-residency- en compliance-vragen die enterprise-klanten bleven stellen.
  • Live updates van MCP server- en tool-instellingen tijdens actieve sessies — geen restart-de-sessie-wrijving meer als je een tooldefinitie aan het itereren bent.
  • Grote tool-outputs vloeien over naar een sandbox-bestand — een verstandige default voor iedereen die ooit een context window heeft opgeblazen met een dikke SQL-resultaatset.
  • Cache-diagnostics in public beta — geef diagnostics.previous_message_id mee in een Messages-request en de API vertelt je precies waar je prompt-cache-prefix afweek van de vorige beurt. Beta-header: cache-diagnosis-2026-04-07.

vii. Andere Anthropic-bewegingen deze week

Een korte sweep van de announcements-feed voor context, ook waar de engineers niet zelf aan het woord waren.

DatumAankondiging
19 meiClaude blijft advertentievrij — beleidsstuk dat betoogt dat advertentieprikkels onverenigbaar zijn met een werkelijk behulpzame assistent.
19 meiKPMG-integratie — Claude uitgerold over het 276.000-koppige personeelsbestand van KPMG.
18 meiStainless-overname — het SDK-generatiebedrijf voegt zich bij Anthropic.
14 meiPwC zet Claude in — voor klantdeals en het opnieuw bouwen van enterprise-functies.
14 meiGates Foundation-partnerschap — $200M, gericht op global health en development-toepassingen.
13 meiClaude for Small Business — connectors en kant-en-klare workflows voor QuickBooks, PayPal, HubSpot, Canva, Docusign, Google Workspace en Microsoft 365.

viii. Wat dit betekent als je met MCP en agents bouwt

Het zwaartepunt is verschoven naar orchestratie. Als je MCP-server nog steeds is ontworpen rond “Claude roept een tool aan, krijgt een resultaat, antwoordt de gebruiker”, bouw je voor het 2025-patroon. Het 2026-patroon is “Claude roept jouw tool aan binnen een zelf-gegradeerde lus, eventueel over meerdere agents, eventueel met notities van eerdere runs die deze run informeren.” Tools die gestructureerde, beoordeelbare output teruggeven — niet alleen tekst — krijgen meer hefboomwerking.

Self-hosted sandboxes maken gereguleerde omgevingen levensvatbaar. Telematica, finance, healthcare: data-residency was de blokker, en nu is er een native antwoord. Het waard om serieus naar te kijken voor .NET/Azure-workloads waar de data het tenant van de klant niet mag verlaten.

Outcomes is het dichtstbijzijnde off-the-shelf equivalent van wat teams handmatig in elkaar hebben gezet met BMAD, Taskmaster AI en vergelijkbare methoden. Als je grader-en-executor-loops met de hand hebt zitten bouwen, wordt de native versie goedkoper in onderhoud.

En tot slot: als Anthropics eigen engineers routinematig PR’s shippen die Claude end-to-end heeft geschreven, is de vraag voor de rest van ons niet meer of je zo wilt werken. Het is hoe snel je je workflow kunt herstructureren — en welke guardrails je nodig hebt zodat let it cook geen let it burn wordt.


ix. Voor de .NET-lezer

Een aantal van de hierboven genoemde aankondigingen landen harder als je dagelijks met C# en Azure werkt.

Self-hosted sandboxes zijn de unlock voor alles wat gereguleerd-maar-interessant is en doorgaans door .NET-shops wordt onderhouden — pensioenberekeningen, claimsverwerking, publieke-sector-workflows. Het patroon dat de meeste teams handmatig in elkaar hebben gezet (Claude Managed Agents die een private API gateway voor Azure-resources aanroepen) krijgt een ondersteund equivalent. De moeite waard om te checken of je compliance-team eindelijk akkoord kan gaan met Managed Agents in plaats van “ChatGPT Enterprise maar plak alsjeblieft geen klantdata.”

MCP-servers in C#. Met live tool-instelling-updates en tunnels in research preview wordt de iteratie-loop op een zelfgebouwde MCP-server drastisch korter. Als je het bouwen ervan hebt uitgesteld omdat de dev-loop traag voelde, krimpt dat excuus. De MCP C# SDK plus dotnet user-secrets en een tunnel dekken het lokaal-naar-Claude-verhaal zonder te redeployen.

Outcomes mapt schoon op xUnit-denken. Een rubric is een test, een grader is een runner, de agent herziet tot groen. Als je een [Theory] met [InlineData]-cases kunt schrijven, kun je een Outcomes-rubric schrijven — wat betekent dat de sprong van “AI helpt me coderen” naar “AI shipt code die ik review tegen een specificatie” kleiner is dan de marketing doet vermoeden.

Het zwaartepunt voor AI-gedreven .NET-werk in de tweede helft van 2026 wordt minder “welke prompt gebruik ik” en meer “wat is de rubric, wat is de sandbox, wat is de lus.” Dat vocabulaire is het nu al waard om mee vertrouwd te raken.


Bronnen

  • MIT Technology Review — “Anthropic’s Code with Claude showed off coding’s future” (21 mei 2026)
  • Anthropic-aankondigingen — anthropic.com/news
  • Releasebot — Anthropic update-feed (16–22 mei 2026)
  • Code with Claude SF-berichtgeving door Simon Willison en MindStudio (6 mei 2026)
  • X-posts van Boris Cherny — @bcherny