Gemini CLI für Design.
Gemini CLI ist Googles quelloffener Terminal-Agent. Seine multimodalen Modelle lesen Screenshots, und sein Kontext mit 1 Mio. Tokens fasst ein ganzes Designsystem — das macht ihn zu einem echten Design-Werkzeug, sobald du ihm Referenzen, Konventionen und eine Verifizierungsschleife gibst. Open Design bindet ihn in einen quelloffenen Design-Workflow ein: dein Google-Konto oder API-Schlüssel, deine Dateien, lokal zuerst.
Open Design verwandelt Gemini CLI in einen lokal-orientierten, quelloffenen Design-Agenten — dein Google-Konto oder Gemini-API-Schlüssel, deine Dateien, eine kuratierte Bibliothek aus Skills und Designsystemen drumherum.
Gemini CLI ist Googles quelloffener KI-Agent für das Terminal. Zwei Dinge machen ihn speziell für Design interessant: seine Modelle sind ausgeprägt multimodal, sodass er einen Screenshot liest und über Layout, Abstände und Hierarchie nachdenkt; und sein Kontextfenster mit 1 Mio. Tokens kann ein ganzes Designsystem und eine ganze Codebasis auf einmal fassen. Kombiniert mit den richtigen Referenzen, Konventionen und einer Verifizierungsschleife baut er echte, responsive UI — und der Einstieg mit einem Google-Konto ist kostenlos. Dies ist ein praktischer End-to-End-Leitfaden zur Nutzung von Gemini CLI für UI-, Frontend- und Designsystem-Arbeit und zu seiner Einbindung in einen strukturierten Design-Workflow mit Open Design.
Er behandelt, was Gemini CLI tatsächlich ist, warum seine multimodalen Modelle und sein riesiger Kontext zu Design passen, wie man ihn von Grund auf einrichtet, die Schleife vom Screenshot zur UI, wie GEMINI.md und MCP ihn erweitern, wie er sich im Vergleich zu Codex, Claude Code und Cursor schlägt, die Fallstricke, die KI-Ausgaben generisch wirken lassen, und wie Open Design die Lücke als offene, lokal-orientierte Design-Ebene schließt — eine natürliche Kombination, da beide quelloffen sind und auf deinem eigenen Rechner laufen.
Was Gemini CLI tatsächlich ist
Gemini CLI ist ein quelloffener (Apache-2.0) KI-Agent, den Google für das Terminal bereitstellt. Er liest dein Repository, bearbeitet Dateien, führt Shell-Befehle aus, ruft das Web ab und kann Antworten mit der Google-Suche absichern — er plant und verifiziert Arbeit aus Aufgaben in natürlicher Sprache, statt nur Zeilen zu vervollständigen. Dieselbe Engine treibt auch den Gemini-Code-Assist-Agenten innerhalb von VS Code an.
Für die Design-Arbeit stechen zwei Eigenschaften hervor. Seine Modelle sind nativ multimodal, sodass du ihm einen Screenshot geben kannst und er über das tatsächliche Layout nachdenkt. Und sein Kontextfenster reicht bis zu 1 Mio. Tokens — groß genug, um dein ganzes Designsystem, deine Komponentenbibliothek und deine Referenzsammlung auf einmal zu fassen, statt sie wegzukürzen.
- Kontextdateien: Gemini CLI liest eine GEMINI.md-Datei für dauerhaften Projektkontext — der natürliche Ort, um deine Design-Konventionen, Tokens und Review-Checklisten festzuhalten. Persönliche und Team-Einstellungen legen sich darüber.
- Eingebaute Tools + MCP: Er bringt von Haus aus Tools für Dateien, Shell, Web-Fetch und Google-Suche mit und unterstützt MCP-Server (konfiguriert in ~/.gemini/settings.json), um externen Kontext wie eine aktive Figma-Datei hinzuzufügen.
- Kostenloser Einstieg: Die Anmeldung mit einem persönlichen Google-Konto bietet ein großzügiges kostenloses Kontingent an Gemini-Anfragen; du kannst auch einen Gemini-API-Schlüssel mitbringen oder Vertex AI nutzen.
- Anbieter: Google
- Zugangsdaten: Google-Konto (kostenloses Kontingent) oder Gemini-API-Schlüssel aus AI Studio (BYOK) oder Vertex AI
- Lizenz: Apache-2.0, quelloffen
Warum multimodale Modelle und ein riesiger Kontext zu Design passen
Der Design-Vorteil von Gemini CLI entspringt zwei Modelleigenschaften — aber, wie bei jedem Agenten, muss der Geschmack weiterhin vom Menschen kommen.
- Starkes multimodales Verständnis: Da Gemini-Modelle nativ multimodal sind, liest der Agent Referenz-Screenshots gut — er vergleicht seine gerenderte Ausgabe mit einem Bild, statt aus einer Prosabeschreibung zu raten.
- Ein Kontextfenster mit 1 Mio. Tokens: Ein großer Kontext bedeutet, dass das ganze Designsystem, die Tokens und viele Referenzzustände auf einmal hineinpassen, sodass der Agent deine echten Primitive wiederverwendet, statt einmalige Stile zu erfinden.
- Konventionen in GEMINI.md: Eine GEMINI.md (zusammen mit dem Figma-MCP-Server) verweist den Agenten auf deine Tokens, Komponenten und echten Spezifikationen, sodass er gegen eine Marke arbeitet statt gegen einen Standard-Look.
Die Lektion ist dieselbe, die jeder Agent lehrt: Gemini CLI hat standardmäßig keinen Geschmack. Es liefert gutes Design, wenn du ihm Vorgaben gibst — ein Designsystem, einen ästhetischen Skill und konkrete Referenzen. Open Design bündelt genau diese Eingaben, und genau deshalb passen die beiden zusammen (mehr dazu weiter unten).
Gemini CLI für die Design-Arbeit einrichten, von Grund auf
Hier ist der vollständige Weg von einem sauberen Rechner zu einem Gemini CLI, das UI bauen und verifizieren kann.
# 1. Install Gemini CLI (Node 20+)
npm install -g @google/gemini-cli
# or run without installing: npx https://github.com/google-gemini/gemini-cli
# 2. Start it in your project and authenticate on first run
cd your-project
gemini # sign in with your Google account, or set GEMINI_API_KEY
# 3. Generate project context
/init # scaffolds a GEMINI.md for this project
# 4. Wire the Figma MCP server (optional, for design handoff)
# add it under "mcpServers" in ~/.gemini/settings.json
- Deine Design-Regeln festhalten: Lege deine Tokens, Primitive und Konventionen in GEMINI.md ab und verweise Gemini darauf, sodass die Ausgabe zu einer Marke passt, statt auf einen generischen Look zurückzufallen.
- Browser-Verifizierung hinzufügen: Binde einen Playwright- oder Browser-MCP ein, damit Gemini in einem echten Browser rendert und seine Ausgabe über Breakpoints hinweg prüft, statt nur zu bestätigen, dass der Build durchläuft.
Der Workflow vom Screenshot zur UI
Die wirkungsvollste Design-Schleife mit Gemini CLI besteht darin, ein Referenzbild in funktionierende, responsive UI zu verwandeln und so lange zu iterieren, bis es passt — gestützt auf das multimodale Modell, das die Ausgabe wieder mit der Referenz vergleicht.
- Beginne mit den klarsten visuellen Referenzen, die du hast — und schließe mehrere Zustände ein (Desktop und Mobil, Hover, leer, ladend), nicht nur einen einzigen Hero-Shot.
- Sei im Prompt konkret; vage Prompts erzeugen generische UI, selbst mit einem starken Modell.
- Halte dein Designsystem und deine Konventionen in GEMINI.md fest und sage Gemini, wo die Tokens und kanonischen Primitive liegen.
- Starte einen Dev-Server und lass Gemini in einem echten Browser rendern, mit Größenanpassung an Breakpoints, um das Ergebnis zu prüfen.
- Iteriere, indem du Gemini seine Implementierung wieder mit den Screenshots vergleichen lässt — und nicht nur bestätigst, dass sie baut.
Verweise mit @ auf ein Bild, um es an den Prompt anzuhängen, und gib dann konkrete Vorgaben:
gemini
# in the prompt:
> @reference-desktop.png @reference-mobile.png
Implement this design in React + Vite + Tailwind + TypeScript.
Reuse my existing design-system components and tokens from GEMINI.md.
Match spacing, layout, and hierarchy; make it responsive.
Render it in the browser and iterate until it matches the references
across breakpoints.Halte Prompts klein und fokussiert, committe gute Iterationen und verwirf schlechte (und teile Gemini mit, wenn du zurücksetzt), sodass jeder Durchgang auf einer sauberen Basis aufbaut.
GEMINI.md, MCP und Erweiterungen
Drei Erweiterungspunkte machen Gemini CLI für nachhaltige Design-Arbeit praktikabel, und alle drei fügen sich sauber in einen offenen Design-Workflow ein.
- GEMINI.md-Kontext: Projektregeln leben in einer GEMINI.md im Wurzelverzeichnis des Repos (mit globalen und Team-Ebenen). Sie ist das dauerhafte Zuhause für deine Design-Konventionen und wird bei jedem Lauf gelesen.
- MCP-Server: Konfiguriere MCP-Server unter ~/.gemini/settings.json — der portable Weg, um Design-Kontext und externe Tools einzubinden, am relevantesten der Figma-MCP-Server, die über Agenten hinweg funktionieren, nicht nur mit Gemini.
- Erweiterungen und eingebaute Tools: Gemini-CLI-Erweiterungen und seine eingebauten Tools für Google-Suche, Dateien, Shell und Web-Fetch lassen ihn Referenzen sammeln und die Verifizierungsschleife durchlaufen, ohne das Terminal zu verlassen.
Das sind portable, agentübergreifende Fähigkeiten — genau die Art von Dingen, die Open Design orchestrieren soll, statt sie pro Projekt neu zu erstellen.
Gemini CLI vs. Codex vs. Claude Code vs. Cursor für Design
Es gibt keinen einzelnen Gewinner für die Design-Arbeit — jeder Agent hat eine andere Stärke, und erfahrene Teams kombinieren sie. Eine faire Zusammenfassung:
| Agent | Design-Stärke | Am besten für |
|---|---|---|
| Gemini CLI | Starkes multimodales Bildverständnis und ein Kontext mit 1 Mio. Tokens; quelloffen mit kostenlosem Kontingent | Screenshot-lastige Arbeit und das Halten eines ganzen Designsystems im Kontext |
| Codex | Starker visueller Feinschliff mit einem Frontend-Skill; gekapselte asynchrone Builds | Delegierte asynchrone Builds und portable AGENTS.md-Regeln |
| Claude Code | Spezifische Design-Entscheidungen (Hex, Abstände, Typografie) und codebasis-bewusstes UX | Frontend-Argumentation und Refactorings mit großem Kontext |
| Cursor | Visuelle Bauen-und-Sehen-Schleife mit Live-Vorschau und Inline-Bearbeitungen | Enge Iterieren-und-Beobachten-UI-Arbeit innerhalb einer IDE |
Das wiederkehrende Urteil der Community lautet, dass Geschmack von Menschen kommt: Sie alle fallen ohne Skills, Referenzen und Vorgaben auf eine generische Ästhetik zurück. Das ist das eigentliche Problem, das es zu lösen gilt — und es hat die Form eines Design-Werkzeugs, nicht die eines Modells.
Fallstricke und wie man den „KI-Schrott“-Look vermeidet
Die häufigste Beschwerde über KI-generiertes Design ist, dass es generisch aussieht — weiche Verläufe, schwebende Panels, übergroße abgerundete Ecken, dramatische Schatten, eine Inter-und-Lila-Stimmung, die „schreit, dass eine KI das gemacht hat“. Weitere gemeldete Probleme sind kaputte mobile Layouts und Anweisungen, die in UI-Texte durchsickern. Keines davon ist einzigartig für Gemini CLI; sie sind das, was passiert, wenn irgendein Agent ohne kuratierten Design-Kontext läuft.
- Einen ästhetischen Skill hinzufügen: Ein kuratierter Design-Skill zwingt den Agenten, sich auf eine echte Richtung festzulegen, statt auf den Standard-Look.
- In einem echten Browser verifizieren: Nutze das multimodale Modell, um über Breakpoints hinweg zu rendern und sich selbst zu prüfen, damit Layouts nicht still auf dem Handy kaputtgehen.
- Tokens und Referenzen bereitstellen: Echte Design-Tokens und Referenz-Screenshots sind der mit Abstand größte Hebel für die Ausgabequalität.
- Regeln in GEMINI.md festhalten: Lege Regeln im Stil von „keine Hero-Karten, maximal zwei Schriftarten, markenorientierte Hierarchie“ dort ab, wo der Agent sie bei jedem Lauf liest.
Beachte, dass jede Abhilfe darum geht, dem Agenten einen kuratierten Design-Kontext zu geben. Diesen Kontext von Hand zu pflegen, pro Projekt, ist genau die Mühe, die Open Design beseitigt.
Mit Gemini CLI innerhalb von Open Design gestalten
Open Design ist die quelloffene Design-Ebene, nach der der obige Workflow immer wieder verlangt. Es behandelt Gemini CLI als First-Party-Adapter und umhüllt ihn mit einer kuratierten Bibliothek aus Skills und Designsystemen, einer strukturierten Render-Pipeline und einer lokalen Desktop-UI — sodass der Design-Kontext, der Gemini gut macht, ab dem ersten Lauf da ist und nicht jedes Mal von Hand zusammengesetzt werden muss. Beide sind quelloffen und lokal-orientiert, was die Kombination zu einer natürlichen Wahl macht.
- Installiere Open Design und wähle Gemini CLI als deinen Agenten.
- Authentifiziere dich mit deinem Google-Konto oder Gemini-API-Schlüssel (BYOK) — die Zugangsdaten bleiben auf deinem Rechner und werden niemals über uns geleitet.
- Wähle ein Designsystem und einen Skill und generiere dann Decks, Prototypen und Landingpages mit konsistentem Geschmack.
- Jedes Artefakt und jede DESIGN.md-Datei liegt in deinem eigenen Repo, nicht in einer gehosteten Cloud.
Derselbe Gemini-CLI-Agent, derselbe Schlüssel — plus ein echter, portabler, quelloffener Design-Workflow drumherum. Es ist lokal-orientiert und Apache-2.0, sodass nichts von deiner Arbeit oder deinen Zugangsdaten deinen Rechner verlässt.
Häufig gestellte Fragen
-
01 Kann Gemini CLI wirklich Design-Arbeit leisten?
Ja — mit einem ästhetischen Skill, einem Designsystem und echten Referenzbildern im Kontext produziert Gemini CLI produktionsreife, responsive UI, und seine starken multimodalen Modelle verifizieren die Ausgabe gegen Referenzen. Ohne diesen Kontext neigt er dazu, auf einen generischen Look zurückzufallen — genau die Lücke, die Open Design füllt.
-
02 Muss ich bezahlen, um mit Gemini CLI zu gestalten?
Nein — die Anmeldung mit einem Google-Konto bietet ein großzügiges kostenloses Kontingent, und du kannst auch einen Gemini-API-Schlüssel mitbringen (BYOK) oder Vertex AI nutzen. Open Design leitet deine Zugangsdaten in keinem Fall weiter.
-
03 Was macht Gemini CLI speziell für Design gut?
Zwei Dinge: Seine Modelle sind ausgeprägt multimodal, sodass er Referenz-Screenshots gut liest, und sein Kontext mit 1 Mio. Tokens kann ein ganzes Designsystem und eine ganze Referenzsammlung auf einmal fassen. Beides hilft — aber der Geschmack kommt weiterhin aus dem Designsystem, dem Skill und den Referenzen, die du lieferst.
-
04 Gemini CLI oder Claude Code für Frontend-Design?
Beide sind stark. Claude Code ist bekannt für spezifische, codebasis-bewusste Design-Entscheidungen; der Vorteil von Gemini CLI ist das multimodale Verständnis plus ein riesiger Kontext und ein kostenloses Kontingent. Viele Teams nutzen beide — Open Design lässt dich die Agenten wechseln, ohne deinen Design-Workflow zu ändern.
-
05 Wie verbinde ich Gemini CLI mit Figma?
Füge den Figma-MCP-Server unter mcpServers in ~/.gemini/settings.json hinzu. Gemini kann dann echten Design-Kontext abrufen — Komponenten, Variablen, Layout-Daten —, sodass der generierte Code zur Quelle passt, statt sie nur anzunähern.
-
06 Ist Open Design mit Google verbunden?
Nein. Gemini CLI ist ein Produkt von Google; Open Design ist ein unabhängiges quelloffenes Projekt, das ihn als First-Party-Adapter unterstützt. Gemini ist eine Marke von Google.
-
07 Sind meine Dateien und Zugangsdaten sicher?
Ja — Open Design ist lokal-orientiert und Apache-2.0. Deine Dateien, Artefakte und DESIGN.md bleiben in deinem eigenen Repo, und deine Google-Zugangsdaten werden direkt von deinem Agenten verwendet, niemals über Open-Design-Server geleitet.
Gestalte mit Gemini CLI, auf die offene Art.
Bring dein eigenes Google-Konto oder deinen Gemini-API-Schlüssel mit, halte jede Datei lokal und erhalte eine kuratierte Design-Bibliothek rund um den Agenten, den du bereits nutzt.