The Autopilot
Posts
GPT-5.6 ist da, aber nicht für dich

GPT-5.6 ist da, aber nicht für dich

Das beste Modell der Welt ist da. Du kommst nicht ran. Hier ist dein kostenloser Plan B, ganz ohne Abo...

Sascha Hoffmann
30. Juni 2026

In partnership with

Hi ,

OpenAI hat am 26. Juni GPT-5.6 vorgestellt. Das Top-Modell heißt Sol und setzt auf fast jedem Benchmark die neue Bestmarke.

Und du? Kommst nicht ran.

Mein erster Reflex war Frust. Beim zweiten Hinschauen war der Frust weg, weil hier eine viel bessere Frage drinsteckt als "wann kommt das zu uns".

Der Engpass ist nicht das Modell. Es ist der Zugang.

Schau dir an, was gerade passiert. OpenAI rollt sein stärkstes Modell über einen limitierten Preview-Ring aus, abgestimmt mit der US-Regierung, weil die Cyber-Fähigkeiten so stark sind. Anthropics Top-Tier ist gerade wegen einer Export-Kontrolle gesperrt. Dazu das altbekannte EU-Muster, dass neue KI-Features über AI Act und Datenschutz später ankommen.

Drei Mechanismen, ein Effekt. Der Zugang zur Spitze wird zum Hebel, den jemand anderes bedient. Eine Regierung, ein Lab, eine Behörde.

Für dich als System Builder verschiebt das die Frage. Nicht mehr "wann bekomme ich GPT-5.6", sondern: wie abhängig ist mein Stack von der Access-Entscheidung von irgendjemand anderem? Wenn dein Business auf einem Modell läuft, das morgen hinter einen Preview-Ring rutschen kann, ist das ein Geschäftsrisiko. Genau da wird Open Source von Nice-to-have zur Versicherung.

Open Source ist 2026 erwachsen

Lass uns reingehen. Ich glaube nicht, dass Europa das Rennen über ein eigenes Frontier-Modell gewinnt. Die Wette ist zu teuer, der Vorsprung der großen Labs zu groß. Der echte Hebel liegt offen herum.

Gemma 4 ist Ende März erschienen, unter Apache-2.0-Lizenz, kommerziell frei nutzbar. Die größte Variante rangiert unter den Top 3 der offenen Modelle auf Arena AI und schlägt Modelle, die zwanzig Mal so groß sind. Das kleine läuft auf deinem Laptop, ein Befehl, ollama run gemma4, offline, ohne dass ein Token deine Maschine verlässt.

Offen heißt nicht schwach. Offen heißt, die Gewichte gehören dir, und niemand kann sie dir per Direktive wegnehmen.

Zwei kostenlose Wege rein: Ollama und OpenRouter

Du brauchst dafür kein Abo und keine Kreditkarte. Es gibt zwei Wege, und beide kosten dich nichts.

Weg eins ist lokal mit Ollama. Du installierst Ollama, tippst ollama run gemma4, und das Modell läuft auf deiner Maschine. Offline, keine Limits, kein Account. Ideal, wenn Daten nicht raus dürfen oder du einfach ohne Rechnung experimentieren willst.

Weg zwei ist gehostet mit OpenRouter, und das ist gerade mein Liebling. Du meldest dich auf openrouter.ai an, ohne Kreditkarte, erstellst einen Key, der mit sk-or- beginnt, und hast Zugriff auf dutzende Modelle über einen einzigen Endpoint, der dem Format der OpenAI-API folgt. Die kostenlosen Modelle erkennst du am Zusatz :free, zum Beispiel qwen/qwen3-coder:free oder deepseek/deepseek-r1:free. Starke offene Modelle, gratis, nur mit Rate-Limit.

Und genau dieses "OpenAI-kompatibel" ist der ganze Trick. Du musst nichts neu bauen. Du steckst den Key in das Tool, das du eh nutzt, oder in fünf Zeilen Python. Wer einen Agent will, fährt Codex komplett lokal über codex --oss mit Ollama, oder hängt Claude Code direkt an OpenRouter. Beides ohne dass du Cursor Pro oder sonst ein Abo zahlst. Den genauen Weg zeige ich im Paid Schritt für Schritt.

Kleine Randnotiz zu NVIDIA: ja, build.nvidia.com verspricht über hundert Modelle gratis. Ich hab es getestet, und der gehostete Dienst war so quälend langsam, dass er für echte Arbeit praktisch unbrauchbar ist. Spar dir den Umweg und nimm Ollama oder OpenRouter.

Der Souveränitäts-Stack in einem Satz

Ganz unten liegen die offenen Modelle, die dir gehören. In der Mitte die Adapter-Schicht, der OpenAI-kompatible Endpoint, über den du das Modell in einer Zeile tauschst. Ganz oben deine Flows und Tools. Wird ein Modell teurer oder gesperrt, tauschst du es unten aus, oben bleibt alles stehen.

Dein erster Schritt diese Woche

Mach es klein. Tipp ollama run gemma4 für den lokalen Weg, oder hol dir auf openrouter.ai den kostenlosen Key und ein :free-Modell. Dann lass es einmal auf einer echten Aufgabe laufen.

GPT-5.6 kommt irgendwann auch zu dir. Bis dahin baust du etwas auf, das niemand per Direktive abschalten kann.

The best prompt engineers aren't typing. They're talking.

Power users figured this out early: speaking a prompt gives you 10x more context in half the time. You include the edge cases, the examples, the tone you want — because talking is fast enough that you don't skip them.

Wispr Flow captures everything you say and turns it into clean, structured text for any AI tool. Speak messy. Get polished input. Paste into ChatGPT, Claude, Cursor, or wherever you work.

89% of messages sent with zero edits. 4x faster than typing. Works system-wide on Mac, Windows, and iPhone.

Start flowing free

Dein erster Loop mit Claude Code oder Codex auf einem offenen Modell

Loops waren auf gezählten Tokens fast fahrlässig. Auf einem offenen oder lokalen Modell wird der erste Loop fast kostenlos. Im heutigen Paid baue ich mit dir genau das, komplett nachbaubar:

Claude Code direkt an OpenRouter hängen und Codex lokal über Ollama fahren, mit Configs zum Kopieren
Der Hybrid: lokales Gemma 4 triggert den Loop, Claude Code übernimmt die Umsetzung
Gate, State-File und Automation, sodass der Loop nachts läuft, während du schläfst

Dieses fortgeschrittene Tutorial ist exklusiv für Premium-Mitglieder verfügbar. Du erhältst:

Fertigen Blueprint zum Kopieren
Zugang zu allen künftigen Premium-Tutorials

Wenn du dich bereit fühlst, dann kann ich dir folgendermaßen helfen:

1) KI ohne Team - 40+ Unternehmer sind schon dabei. Die KI Agenten Community für Menschen die was umsetzen wollen. Fertige KI-Systeme, die du lädst und sofort einsetzt. Jede Woche neue. Von Leuten, die damit ihr eigenes Geschäft betreiben.

2) KI Agenten Management Framework Paperclip - Das One-Click-Deployment für Paperclip. Mach dir selbst keinen Kopf mehr um das technische Setup. Lass den Agenten einfach für dich arbeiten. => Mit SASCHA10 bekommst du auch Rabatt im Checkout.

3) Lead-Gen-System für dein SaaS Produkt - ich habe ein Lead-Gen-System, das auf KI und den aktuellsten Marketing-Trends basiert und dir nachhaltig Leads generiert.

Reply

or to participate.