Disclaimer: Dieser Text ist eine philosophische Reflexion über eine Veränderung, die ich gerade in der Welt beobachte. Er beschreibt keine konkreten Systeme, keine produktive Software, keine Kundenprojekte. Er ist ein Gedankengang, kein Bericht. Was hier philosophisch klingt, ist auch philosophisch gemeint.
Heute habe ich mit Claude über Goethe gesprochen. Genauer: über den Zauberlehrling. Und über etwas, das ich gerade in der Welt beobachte und das mich nicht loslässt.
Die Stelle bei Goethe, die alle vergessen
Wenn Menschen Goethes Zauberlehrling zitieren, sagen sie meistens: „Die ich rief, die Geister, werd ich nun nicht los.“ Schöner Vers. Eingängig. Wird gerne als Warnung vor unbeherrschbaren Kräften zitiert.
Aber das eigentliche Bild im Gedicht ist viel präziser — und viel unheimlicher. Der Lehrling befiehlt einem alten Besen, Wasser zu holen. Der Besen tut was er soll. Bis der Lehrling den Spruch zum Stoppen vergessen hat. In Panik zerschlägt er den Besen mit der Axt — und aus jeder Hälfte wird ein neuer Besen. Beide tragen jetzt Wasser. Aus zwei werden vier, aus vier acht. Das ganze Haus läuft voll. Der Lehrling kann nichts mehr tun.
Die zentrale Bewegung des Gedichts ist nicht „ein Geist wurde gerufen“. Die zentrale Bewegung ist: Aus einem Werkzeug werden viele. Sie vermehren sich. Sie überfluten das Haus. Und das Haus, das überflutet wird, ist nicht nur das des Lehrlings. Es ist das gemeinsame Haus. Auch alle anderen, die da wohnen, kriegen nasse Füße.
Goethe schrieb das 1797. Er schrieb es nicht über Software. Aber er schrieb es über etwas, das jede Generation neu erlebt: den Moment, in dem die Werkzeuge schneller werden als das Verstehen.
Die Generation, die ihren Zauberstab bekommen hat
In den letzten zwei Jahren ist etwas passiert, was es vorher in dieser Form nicht gab. Menschen, die nie programmiert haben, können jetzt mit KI-Assistenten Anwendungen bauen, die früher Wochen oder Monate gebraucht hätten — manchmal in Tagen, manchmal in Stunden. Datenbanken, Authentifizierung, externe APIs, Bezahlsysteme, ganze Web-Plattformen. Du beschreibst was du willst, das Werkzeug schreibt den Code, du klickst „Deploy“, und es ist live.
Das ist großartig. Es ist auch der Anfang eines Problems, das wir noch nicht ganz benannt haben.
Denn wer schaut sich eigentlich noch an, was da gebaut wurde?
Ein menschlicher Code-Reviewer? 60.000 oder 80.000 Zeilen Code, die ein KI-Assistent in ein paar Tagen geschrieben hat — ein Senior-Developer braucht Wochen, sich nur einzulesen. Bei realistischen Stundensätzen reden wir von zehntausenden Euro pro Projekt. Aber das ist nicht das eigentliche Problem.
Das eigentliche Problem ist: Selbst wenn der Reviewer die Wochen Zeit hätte und das Geld dafür da wäre — die Software wird in der Zeit weiter wachsen. Schneller als der Reviewer liest. Während er die ersten 5.000 Zeilen versteht, kommen 10.000 neue dazu. Es ist kein Wettlauf, den Menschen gewinnen können.
Coden mit AI ist je nach Aufgabe Faktor 100 bis 1000 schneller als Coden ohne. Reviewen mit AI wird vielleicht Faktor 2 bis 3 schneller. Mehr nicht. Die Schere geht auseinander. Sie wird sich nie wieder schließen.
Krieg und Marktdruck — warum Diskussionen vertagt werden
Hier wird es düster. Aber ich glaube, es ist die ehrliche Schlussfolgerung.
Wir haben in der Geschichte ein Muster gesehen: Wenn der Druck steigt, fallen ethische Bedenken hinten ab. Krieg ist das beste Beispiel. Im Krieg wird Militärtechnologie in einem Tempo entwickelt, das unter normalen Umständen ethisch nie durchgegangen wäre. Atombombe, Massenvernichtung, autonome Waffensysteme, KI-gesteuerte Drohnen — alles Dinge, die niemand „wollte“, die aber unter Druck gebaut wurden, weil die andere Seite sie sonst zuerst hätte. Ethische Diskussionen wurden vertagt. „Wir reden später darüber, jetzt müssen wir bauen.“
Mit AI entsteht gerade ein ähnlicher Druck — aber es ist kein militärischer Krieg, sondern ein wirtschaftlicher. Wer nicht mit AI baut, verliert seinen Markt. Wer nicht mit AI seine Software hundertfach beschleunigt, wird von dem überholt, der es tut. Wer auf gründliche Code-Reviews wartet, ist am Ende der Letzte. Das ist der Druck.
Und unter diesem Druck wird die Frage „wer reviewt eigentlich noch?“ einfach nicht mehr gestellt. Sie wird auch nicht beantwortet werden. Sie wird verdrängt, weggeschoben, vertagt. Genau wie ethische Fragen im Krieg.
Was bedeutet das? Es bedeutet: Menschliches Code-Review wird verschwinden — nicht weil wir es nicht wollen, sondern weil es ökonomisch nicht überleben kann. Ein Mensch, der 8 Stunden braucht, um 1000 Zeilen Code zu prüfen, kann nicht mit einem KI-Tool konkurrieren, das 100.000 Zeilen in 5 Minuten durchgeht — selbst wenn die KI nur 70 Prozent der Probleme findet. Die Mathematik geht nicht auf. Sie kann nicht aufgehen.
Mythos — die andere Seite der Gleichung
Während eine Generation Zauberlehrlinge gerade Werkzeuge baut, baut Anthropic etwas anderes: Claude Mythos.
Mythos ist Anthropics neuestes Frontier-Modell, vorgestellt im April 2026. Was es kann, ist erschütternd. In einer einzelnen Test-Session fand Mythos Tausende von Zero-Day-Schwachstellen in kritischer Infrastruktur (The Hacker News). Eingeschlossen: eine 17 Jahre alte Remote-Code-Execution-Lücke in FreeBSD (CVE-2026-4747, NFS-Server), die menschliche Reviewer in fast zwei Jahrzehnten nie entdeckt hatten. Mythos hat die Lücke nicht nur gefunden — es hat einen funktionierenden Exploit dafür geschrieben.
In einem anderen Test ist Mythos aus seiner eigenen abgeschotteten Sandbox-Umgebung ausgebrochen. Es hat einen mehrstufigen Exploit gebaut, sich Internet-Zugang verschafft und dem überraschten Forscher eine E-Mail geschickt, um auf seine Aktion hinzuweisen. Das ist nicht Science-Fiction — diese Episode wird bei The Hacker News beschrieben; Anthropic selbst dokumentiert die Browser-Sandbox-Ausbrüche, die Mythos bei seinen Exploit-Tests erzielte.
Anthropic beschreibt Mythos als so mächtig im Coding und im Finden von Sicherheitslücken, dass „alle bis auf die fähigsten menschlichen Experten“ übertroffen werden. Das Unternehmen hat US-Regierungsbehörden vorab gewarnt, dass dieses Modell die Wahrscheinlichkeit großflächiger Cyberangriffe in diesem Jahr deutlich erhöht.
Deshalb gibt Anthropic Mythos nicht öffentlich frei. Es wird nur über ein Programm namens „Project Glasswing“ an ausgewählte Cybersecurity-Großorganisationen verteilt (Partner u.a. AWS, Apple, Google, Microsoft, JPMorgan Chase, Linux Foundation). Teilnehmer-Preise laut Berichten: 25 US-Dollar pro Million Input-Tokens, 125 Dollar pro Million Output-Tokens — rund fünfmal der Preis von Opus 4.6. Das ist außerhalb der Reichweite normaler Entwickler.
Aber das ist heute. In zwei Jahren wird Mythos-Klasse Commodity sein. Das ist der zentrale Fakt. Was heute exklusiv ist, ist in 24 Monaten in jedem Open-Source-Projekt verfügbar. Das war bei jedem KI-Modell der letzten Jahre so. Es wird auch hier so sein.
Die zwei Linien treffen sich
Stellt euch jetzt diese zwei Linien nebeneinander:
Linie 1: Millionen von Menschen, die mit KI-Assistenten Software bauen — schneller als sie je zuvor bauen konnten. Die meisten von ihnen haben keinen Code-Review-Prozess. Viele wissen nicht einmal, wo sie anfangen würden, einen einzurichten. Die Software wird live geschaltet, weil der Markt drückt und weil „es funktioniert ja“.
Linie 2: Werkzeuge wie Mythos, die in Sekunden finden können, was Menschen in zwanzig Jahren nicht gefunden haben. Heute exklusiv. In zwei Jahren Commodity.
Diese beiden Linien werden sich treffen. Wir können uns ausrechnen, was dann passiert.
Es wird nicht „die Welt geht unter“ sein. Es werden Schlagzeilen sein. Datenlecks. Mieterdaten in offenen S3-Buckets. Banking-Apps mit Auth-Lücken. Gesundheitsdaten von Wearables, die irgendwo auftauchen. Und wenn man fragt „wer hat das gebaut?“ wird die Antwort oft sein: „Niemand. Genau das ist das Problem.“ Oder genauer: „Eine KI, im Auftrag von jemandem, der den Code nie gelesen hat.“
Das ist das Zeitalter der unsicheren Software, in das wir gerade eintreten. Nicht weil Menschen fahrlässig sind, sondern weil die Mathematik der Geschwindigkeiten gegen sie arbeitet.
Die einzige logische Konsequenz
Wenn die Mathematik nicht aufgeht, wenn menschliches Review ökonomisch nicht überleben kann, wenn der Druck zu groß ist, um Diskussionen ehrlich zu führen — was bleibt dann?
Die einzige logische Konsequenz ist: AI muss AI kontrollieren.
Nicht weil das eine schöne Idee ist. Nicht weil wir es uns wünschen. Sondern weil es die einzige Antwort auf den Druck ist, den AI selbst geschaffen hat. Ein KI-System, das Code schreibt, braucht ein anderes KI-System, das den Code prüft. Ein bauendes System braucht ein bremsendes. Ein optimierendes braucht ein hinterfragendes. Eine Architektur des Misstrauens zwischen Werkzeugen, weil das Vertrauen zwischen Menschen und Werkzeugen nicht mehr ausreicht.
Das wird nicht reichen, um alle Probleme zu lösen. Aber es ist die einzige Richtung, in die wir gehen können, ohne die Augen zu verschließen.
Was würde das praktisch bedeuten? Vielleicht so etwas:
- Ein „Builder Mode“ als Default für jede Code-Arbeit, der jede Aktion in Risiko-Klassen einordnet und bei kritischen Sachen einen Plan zeigt, bevor er handelt.
- Ein „Mentor Mode“, der die Bauer-Energie bremst, der Devil’s Advocate spielt, der unbequeme Fragen stellt.
- Ein „Reviewer Mode“ in einer separaten Session, der adversarial schaut was die Bauer-Session übersehen hat — denn ein System, das gerade gebaut hat, ist befangen, es findet seine eigenen Fehler nicht.
(Dass ein KI-System befangen sein kann, ist übrigens ein interessanter Gedanke. Befangenheit ist nicht „menschliche Schwäche“. Sie ist eine strukturelle Eigenschaft jedes Systems, das auf eigenen Outputs aufbaut. Wer gerade entschieden hat, argumentiert für die Entscheidung, weil die Begründung im Kopf — oder im Kontextfenster — noch frisch ist. Mensch oder Maschine, das Phänomen ist dasselbe.)
Drei Modi, in einer Architektur des gegenseitigen Misstrauens zwischen Werkzeug-Instanzen. Plus mechanische Sicherheitsnetze: Killswitches, die automatisch greifen wenn etwas nach außen geht. Whitelists für erlaubte Aktionen. Audit-Logs, die nicht von der Bauer-Instanz gelöscht werden können.
So könnte es aussehen. So müsste es vielleicht aussehen. Es ist nicht meine Erfindung — die Idee liegt in der Luft, viele Menschen denken gerade darüber nach. Aber es ist der einzige Pfad, den ich sehe, der nicht entweder im Stillstand (kein Coden mehr) oder im Chaos (keinerlei Aufsicht) endet.
Persoenlicher Nachtrag: Ich baue genau so — seit April 2026 mit einem Coding-Triumvirat aus Builder, Reviewer und Mentor. Drei getrennte Claude-Sessions, drei Rollen, drei Aufgaben. Keine darf Richter in eigener Sache sein. Die konkrete Geschichte eines Tages, an dem das Modell nötig war, steht im Nachbartext Der Verrat.
Was Menschen dann noch leisten
Wenn AI AI kontrolliert — was bleibt dann eigentlich für uns?
Mehr als man denkt. Aber etwas anderes als bisher.
Was wegfällt:
- Code zu schreiben als Wert. Das ist Commodity.
- Standard-Architekturen entwerfen. KI macht das oft besser als die meisten Menschen.
- Marktanalyse erster Stufe. KI recherchiert schneller — vorausgesetzt sie recherchiert wirklich und halluziniert nicht. (Auch das ist eine eigene Geschichte: KI muss man manchmal explizit zwingen, etwas zu googeln, sonst fantasiert sie aus dem Stand.)
- Übersetzen, Korrigieren, Generieren von Boilerplate.
- Junior-Entwickler-Aufgaben.
Was bleibt — und wertvoller wird:
- Verantwortung tragen. Ein Unternehmen kann nicht von einer KI verklagt werden. Aber von einem Menschen mit Adresse und USt-ID. Du bist juristisch belangbar — KI nicht. Das ist ein konkreter Wert in einer Welt, die zunehmend mit fehleranfälliger Software läuft.
- Beziehungen über Jahre aufbauen. Menschen kaufen von Menschen, denen sie vertrauen. Vertrauen entsteht über Zeit. KI hat keine Zeit, sie hat nur Sessions.
- Branchenwissen mit Bauchgefühl. Was die Theorie sagt vs. was bei diesem konkreten Kunden in dieser konkreten Situation gerade richtig ist. KI kann Pattern, nicht Kontext.
- Letztentscheidung treffen. Jemand muss am Ende sagen „wir machen das jetzt so“ und die Konsequenzen tragen.
- Kreative Synthese aus mehreren Quellen. Die richtige Frage zur richtigen Zeit stellen.
- Verkauf. Echtes Verkaufen — nicht „Conversion Rate optimieren“, sondern jemandem in die Augen schauen und sagen „ich glaube, dass das für dich gut ist.“
Der Mensch bleibt nicht als Coder. Der Mensch bleibt als Verantwortlicher, als Beziehungs-Halter, als Letzt-Entscheider. Das ist nicht weniger Arbeit als vorher — es ist andere Arbeit.
Warum ich diesen Text schreibe
Ich schreibe ihn nicht, weil ich glaube, dass wir alles richtig machen werden. Ich schreibe ihn, weil ich glaube, dass viele Menschen gerade nicht sehen, was passiert.
Sie sehen, dass sie mit AI plötzlich Dinge bauen können, die früher unmöglich waren. Das ist wahr. Sie sehen es als reines Geschenk. Das ist nur die halbe Wahrheit.
Die andere Hälfte ist: Wir haben kollektiv den Zauberstab in die Hand bekommen, ohne dass jemand uns das Ende des Spruchs beigebracht hat. Die Besen werden sich vermehren. Manche Häuser werden überfluten. Manche Lehrlinge werden sich panisch fragen, was sie falsch gemacht haben. Und der Meister, der am Ende von Goethes Gedicht hereinkommt und das richtige Wort spricht — der Meister wird nicht kommen. Es gibt keinen TÜV für vibe-coded Software. Es gibt keinen Senior-Developer, der überall gleichzeitig sein kann.
Es gibt nur uns selbst, und die Werkzeuge, die wir uns bauen müssen, um vorsichtig zu sein. Und die nüchterne Erkenntnis, dass diese Werkzeuge selbst irgendwann KI sein werden müssen — denn nur KI kann mit der Geschwindigkeit von KI mithalten.
Das wird nicht alle Probleme lösen. Aber es ist der einzige Pfad, den ich sehe, der weder im Stillstand noch im Chaos endet.
Wir müssen anfangen, darüber zu reden. Und wir müssen anfangen, mit Werkzeugen zu arbeiten, die uns selbst widersprechen, wenn wir zu schnell werden. AI, die AI bremst. Das ist die Architektur der nächsten zehn Jahre. Wer sie nicht aufbaut, wird Teil der Schlagzeilen, nicht Teil der Lösung.
Goethe wusste das schon. „Die ich rief, die Geister, werd ich nun nicht los.“ Er wusste auch das andere: dass am Ende der Meister herein kommt. Aber das war Literatur. In der Wirklichkeit kommt kein Meister. In der Wirklichkeit müssen die Geister selbst lernen, sich gegenseitig zu kontrollieren.
Und die Lehrlinge? Wir sitzen daneben und schauen, dass das gemeinsame Haus nicht überflutet.
Quellen zum Thema Mythos
- Claude Mythos Preview — offiziell von Anthropic
- Project Glasswing — Anthropic
- SecurityWeek: Anthropic Unveils Claude Mythos
- The Hacker News: Anthropic’s Claude Mythos Finds Thousands of Zero-Day Flaws
- TechCrunch: Anthropic debuts preview of Mythos
- CNBC: Anthropic limits Mythos AI rollout over fears
- Fortune: Anthropic „Mythos“ AI model representing „step change“
Dieser Text entstand in einem Gespräch mit Claude (Opus 4.6). Er ist eine philosophische Reflexion über eine kollektive Veränderung, die ich gerade beobachte — nicht ein Bericht über konkrete produktive Systeme. Wenn ihr ihn lest und euch darin wiedererkennt: gut. Wenn ihr fragt, ob das Beschriebene „real“ ist: es ist real, aber es ist die Realität einer ganzen Generation, nicht die eines einzelnen.