Wie gut ist Opus 4.7?

Das neue Modell kann zwei Stunden autonom arbeiten. Dein Token-Budget ist in der Hälfte der Zeit leer...

Hi ,

Opus 4.7 ist seit letzter Woche live. Die Schlagzeilen klingen fantastisch: Agents die zwei Stunden am Stück arbeiten. Ein neues Effort Level zwischen high und max. Auto Mode der intelligent Permission-Entscheidungen trifft statt pauschal zu fragen.

In den gleichen Threads melden Leute dass ihr Weekly Quota doppelt so schnell aufgebraucht ist wie vorher. Mehr Stream Idle Timeout Errors. Und die Frage die alle stellen:

Wie bekomme ich mehr aus dem Modell ohne ständig gegen Limits zu laufen?

Ich hab Opus 4.7 eine Woche lang ausgiebig getestet. Hier ist mein ehrliches Fazit: was wirklich besser ist, wo die Fallen liegen, und was Boris Cherny (Anthropic) selbst empfiehlt.

Was Opus 4.7 besser macht

Code Refactoring ist spürbar stärker. Komplexe Multi-File Umbauten die in 4.6 noch mehrere Runden Nachbesserung gebraucht haben, sitzen jetzt häufiger beim ersten Mal. Die Fähigkeit, über lange Sessions hinweg konsistent zu arbeiten, hat sich deutlich verbessert.

Boris Cherny hat sechs offizielle Tipps veröffentlicht. Die wichtigsten für deinen Workflow:

Auto Mode (Shift-Tab) ersetzt das alte --dangerously-skip-permissions. Ein Classifier beurteilt jetzt jeden Befehl einzeln statt pauschal alles durchzuwinken. Seiteneffekt: Du kannst mehrere Claude Sessions parallel laufen lassen. Verfügbar auf Max, Teams und Enterprise, wird aber stufenweise ausgerollt.

/effort setzt das Effort Level pro Session. xhigh ist neu in 4.7 und sitzt zwischen high und max. xhigh für den Daily Driver, max nur für die härtesten Tasks. Wichtig: max gilt nur für die aktuelle Session, die anderen Level bleiben über Sessions hinweg bestehen.

/focus blendet alle Zwischenschritte aus. Du siehst nur das Endergebnis. Wenn du dem Modell vertraust, den richtigen Befehl auszuwählen und das richtige Edit zu machen, brauchst du den Prozess nicht mehr zu beobachten.

Recaps passieren automatisch. Du verlässt eine lange Session, kommst nach ein paar Stunden zurück, und oben steht eine Zusammenfassung: Was der Agent gemacht hat und was als nächstes ansteht. Kein Befehl nötig.

/less-permission-prompts scannt deine Session-History und findet Bash- und MCP-Befehle die sicher sind aber ständig Permission-Prompts auslösen. Generiert eine Allowlist. Boris hat es /fewer-permission-prompts genannt, der echte Befehl ist /less-.

Vier Pitfalls die ich nach einer Woche kenne

Creative Writing wird flacher. 4.7 dominiert bei Code, übertreibt es aber bei kreativem Text. Die Logik liest sich sauber, die Stimme flacht ab. Für Creative Writing und Voice Mimicry bleib bei 4.6 oder Sonnet. Möglicherweise hat Anthropic etwas destilliert das die kreative Flexibilität gekostet hat.

Persona-Prompts funktionieren nicht mehr. "Pretend you're a senior engineer who spent 10 years at Linear and Stripe" bringt bei 4.7 nichts. Das Modell reagiert jetzt auf structured markdown memory und konkrete Constraints. Die Konsequenz: Tausche Persona-Prompts gegen explizite Error-Handling Policies, Testing Requirements und File-Structure Conventions.

Überfüllte CLAUDE.md wird ignoriert. In langen Sessions wenn das Context Window sich füllt, überspringt das Modell eine zu lange CLAUDE.md. Die Lösung: Teile die Regeln in On-Demand Skill Files auf und behalte nur den Core Few-Shot und die Project Map in der CLAUDE.md. In KW11 haben wir Skills als Ordner mit Markdown-Dateien beschrieben. Das ist genau wo diese Regeln hingehören.

Vibe Coding driftet ab Iteration 7. Naming, State, Edge Cases verschieben sich leise über lange Iteration Chains. Die Lösung ist ein erzwungener Recap alle N Steps und ein Eval Loop der echte Tests laufen lässt. "Sieht richtig aus" zählt nicht.

Die ehrlichen Takes

Vier Dinge die in den offiziellen Ankündigungen fehlen.

xhigh als Default verbrennt Tokens schnell. Die Threads sind voll mit Leuten die berichten dass ihr Weekly Quota sich schneller leert als bei 4.6. Dazu kommen mehr Stream Idle Timeout Errors. Dreh das Effort Level manuell runter wenn du nicht die extra Reasoning-Depth brauchst.

Auto Mode rollt stufenweise aus. Das --enable-auto-mode Flag ist aus der CLI verschwunden und der richtige Tier garantiert nicht dass du die Option siehst. Warte ein paar Tage wenn es noch nicht auftaucht.

Skill Invocation ist strenger geworden. Das Modell braucht jetzt einen exakt registrierten Skill-Namen oder einen vom User getippten /xxx Befehl. Skills die du bisher per Implikation getriggert hast, können jetzt still fehlschlagen.

Und eine gute Nachricht: "Don't create new files" ist jetzt nur noch Preference. Wenn es einen echten Grund gibt, erstellt das Modell neue Dateien. Gut für Scaffolding und Multi-File Refactors.

Das Token-Problem hinter der Power

Die neue Power hat einen Preis. xhigh generiert mehr Tokens pro Turn. Token-Kosten wachsen quadratisch mit der Konversationslänge: Message 30 kostet 31x mehr als Message 1.

Ein Entwickler hat seine Nutzung getrackt und festgestellt dass 98.5% seiner Tokens für das Wiedereinlesen der History draufgehen. Nur 1.5% für den tatsächlichen Output.

Die grössten Einsparungen kommen nicht von kürzeren Prompts. Sie kommen davon, wie du deine Sessions strukturierst. Effort Level bewusst steuern, Sessions rechtzeitig resetten, den richtigen Hack für die richtige Situation wählen.

Happy Building

Die Top 8 Token-Sparr-Hacks nach Impact

morgen gehe ich tiefer auf folgendes ein:

  • 8 konkrete Hacks sortiert nach Token-Ersparnis (30% bis 80%)

  • 3 Copy-Paste Prompts: Caveman Prompt, Compact Skill, PDF-Kompression

  • Die Mathematik hinter dem Token-Verbrauch und warum Sessions kürzer sein sollten

Dieses fortgeschrittene Tutorial ist exklusiv für Premium-Mitglieder verfügbar. Du erhältst:

  • Komplettes Video-Tutorial

  • Fertigen Blueprint zum Kopieren

  • Zugang zu allen künftigen Premium-Tutorials

Wenn du dich bereit fühlst, dann kann ich dir folgendermaßen helfen:

1) KI ohne Team - 40+ Unternehmer sind schon dabei. Die KI Agenten Community für Menschen die was umsetzen wollen. Fertige KI-Systeme, die du lädst und sofort einsetzt. Jede Woche neue. Von Leuten, die damit ihr eigenes Geschäft betreiben.

2) KI Agenten Management Framework Paperclip - Das One-Click-Deployment für Paperclip. Mach dir selbst keinen Kopf mehr um das technische Setup. Lass den Agenten einfach für dich arbeiten. => Mit SASCHA10 bekommst du auch Rabatt im Checkout.

3) Lead-Gen-System für dein SaaS Produkt - ich habe ein Lead-Gen-System, das auf KI und den aktuellsten Marketing-Trends basiert und dir nachhaltig Leads generiert.

Reply

or to participate.