Virale Video-Konzepte mit Gemini 2026: Vom Referenzvideo zur Content-Serie in drei Prompts
Virale Video-Konzepte entstehen 2026 nicht mehr im Bauchgefühl, sondern im Workflow. Drei strukturierte Prompts an Gemini reichen, um aus einem einzigen Referenzvideo eine komplette Content-Serie inklusive Tabellen-Drehbuch abzuleiten — von Reverse-Engineering über Ideation mit Creative Constraints bis zum produktionsreifen Skript. Hier ist der Workflow, den wir bei WHATthePLAN für unseren Creator-Roster operationalisiert haben.
Warum Reverse-Engineering der Schlüssel ist
Die meisten Creator versuchen, virale Video-Konzepte aus dem Nichts zu erfinden. Das funktioniert nicht skalierbar. Der schnellere Weg dreht die Frage um: Welches Video läuft bereits — und warum? Daraus baust du dein eigenes Format.
Plattformen wie TikTok, Instagram Reels und YouTube Shorts belohnen 2026 nicht das originellste, sondern das am besten strukturierte Video. Hook, Pacing, Tonalität und Payoff lassen sich an viralen Referenzen zerlegen und auf neue Inhalte übertragen. Das ist kein Klauen — das ist Format-Engineering. Und KI macht diesen Schritt zum ersten Mal in unter zehn Minuten möglich.
Gemini ist dabei das richtige Werkzeug, weil es native Multimodal-Inputs verarbeitet — du lädst das Video direkt als Datei-Anhang hoch, und die KI analysiert Visuelles, gesprochenen Text und Pacing in einem Durchgang. Wer mit den Modell-Generationen Schritt halten will, sollte die offizielle Gemini-Update-Seite von Google abonniert haben. Die Sprünge in Video-Verständnis kommen quartalsweise.
Wo KI im Creator-Workflow wirklich Hebel hat
- Analyse-Phase — virale Videos in Sekunden zerlegen statt sie manuell zu transkribieren und zu sezieren.
- Ideation — Format-Variationen unter klaren Constraints generieren, ohne Bauchgefühl-Brainstorming.
- Skripting — vollständige Drehbücher in der Tonalität des Originals, inklusive Voice-Over und Overlays.
- Konsistenz über Serien — derselbe Chat-Kontext hält Sprache und Pacing über zehn oder mehr Episoden stabil.
- Reporting-Loop — gleicher Workflow zurück: Welche Episode funktionierte, welcher Beat war der Peak, welche Variante als nächstes?
Material-Vorbereitung und der Style-Decoder
Bevor Gemini analysieren kann, brauchst du das Material. Die Vorbereitung dauert keine drei Minuten — aber sie entscheidet, wie tief die KI dein Referenzvideo zerlegt.
Schritt für Schritt: Vom Link zum Upload
- Suche ein virales TikTok- oder Reels-Video in deiner Nische und kopiere den Link. Wähle bewusst — ein generisches Tanz-Reel taugt nicht als Vorlage für Hundetraining-Content.
- Lade das Video über snapinsta.app oder ein vergleichbares Tool herunter. Datei-Format MP4, Auflösung egal — Gemini braucht den Audio-Track, nicht 4K.
- Öffne gemini.google.com, starte einen neuen Chat und lade das Video als Datei-Anhang hoch. Wichtig: denselben Chat für die gesamte Serie beibehalten — die Tonalität bleibt sonst nicht konsistent.
- Schreibe den Analyse-Prompt aus dem nächsten Abschnitt. Nicht improvisieren — die Spezifität dieses ersten Prompts entscheidet über die Qualität aller folgenden Outputs.
Prompt 1 — Der Style-Decoder
- 01 Aufbau & Dramaturgie Hook, Struktur (z. B. Problem-Lösung), Spannungsbogen
- 02 Schnitt & Editing Pacing, Übergänge, Kameraperspektiven, Cuts pro Sekunde
- 03 Sprache & Tonalität Wortwahl, Anrede, Sprechtempo, Slang, Pausen
- 04 Fachlicher Inhalt Ist der Inhalt logisch, korrekt, übertragbar?
Der vollständige Prompt formuliert sich entlang dieser vier Ebenen: „Analysiere das angehängte Video sehr ausführlich auf folgenden Ebenen: erstens Aufbau und Dramaturgie, zweitens Schnitt und Editing, drittens Sprache und Tonalität, viertens fachlicher Inhalt.“ Die Ausführlichkeits-Klausel ist kein Filler. Ohne sie liefert Gemini eine Drei-Satz-Zusammenfassung — und du verlierst genau die Mikro-Details, die später dein Drehbuch klingen lassen wie das Original.
Was Gemini liefert — Fallstudie „Gefrorener Napf“
Als Fallstudie für diesen Artikel arbeiten wir mit einer TikTok- und Reels-Serie mit dem Titel „30 Tage Indoor-Beschäftigung für Hunde“. Das Referenzvideo „Gefrorener Napf“ — ein Indoor-Hack für Regentage — wurde von Gemini in unter 30 Sekunden zerlegt: Problem-Lösung-Struktur (Wetter blockiert Spaziergang → Indoor-Beschäftigung in unter fünf Minuten), Gamification durch die Nummerierung „eins von dreißig“, Selfie-Perspektive im Hook für Relatability, POV-Aufnahmen und Zeitraffer im Mittelteil, platter Hund als Payoff. Zur Tonalität: kumpelhaft, direkt, Anrede mit „Ihr“ und „Hundemenschen“, Slang wie „Hacks“ und „Endgegner“, schnelles Sprechen ohne Pausen.
Ideation mit Creative Constraints
Kreativität ohne Grenzen produziert Stockfotos. Kreativität unter klaren Constraints produziert Hits. Phase 03 dreht sich darum, wie du Gemini zwingst, brauchbare, drehfertige Ideen zu liefern — statt einer Liste aus „seien Sie authentisch“-Floskeln.
Sobald Gemini die DNA verstanden hat, skalierst du das Format. Das Ziel ist eine Content-Engine, nicht nur ein einzelnes Video. Und hier liegt der wichtigste Hebel: Creative Constraints. Enge Rahmenbedingungen zwingen die KI zu kreativen, umsetzbaren Konzepten — statt generischer Ratschläge, die jeder Hundeblog 2018 schon publiziert hat.
Drei Constraint-Achsen, die immer funktionieren
- NischeEng definieren — nicht „Hundecontent“, sondern „Indoor-Beschäftigung für Hunde“. Je präziser, desto besser die Ideen. Bei einer breiten Nische generiert die KI generische Allgemeinplätze.
- BudgetSetze einen harten Rahmen, im Idealfall 0 Euro. Constraint: nur Haushaltsgegenstände, keine gekauften Spezial-Tools. Das filtert sofort 90 % der naheliegenden Vorschläge aus — und zwingt die KI in Life-Hack-Modus.
- Aufwand pro EpisodeMaximal fünf Minuten Vorbereitung. Wer es zu Hause nicht in fünf Minuten umsetzen kann, speichert es nicht — und genau Save-Rate ist der Algorithmus-Hebel, den du willst.
Prompt 2 — Der Scaling-Prompt
Du instruierst Gemini im selben Chat als Redakteur und gibst alle Constraints mit. Die Formulierung: „Erstelle mir auf Basis dieses Videos und des Konzepts zehn weitere Konzepte zur Erstellung weiterer Teile dieser Serie. Constraints: Nische Indoor-Beschäftigung für Hunde, Budget null Euro (nur Haushaltsgegenstände), Aufwand unter fünf Minuten pro Idee.“ Die Zahl zehn ist bewusst gewählt — sie zwingt die KI über die offensichtlichen Vorschläge hinaus und produziert auf Platz sieben bis zehn häufig die stärksten, weil ungewöhnlichsten Konzepte.
Auszug aus den Ergebnissen
- Tag 02 — Handtuch-Rouladen-Spiel. Futter in ein altes Handtuch einwickeln und verknoten. Jeder Haushalt hat ein Handtuch. Entry Barrier: null.
- Tag 03 — Muffin-Form-Lotterie. Leckerlis in ein Muffinblech, Tennisbälle darüber. Hund muss die Bälle bewegen, um an das Futter zu kommen.
- Tag 04 — Karton-Konfetti-Party. Altpapier und Leckerlis in einen Karton, Wühlen erlaubt. Visuell extrem dankbar (POV-Top-Down, Chaos-Ästhetik).
- Tag 05 — Socken-Wurst. Leere Plastikflasche in eine Socke stecken. Knistergeräusche sind der Hit, Sound-Hook eingebaut.
- Tag 06 — Hosen-Suchspiel. Leckerlis in den Taschen einer alten Jeans verstecken. Storytelling-Bonus: jeder kennt die alte Jeans.
Für die Produktion wählen wir Tag 02 — das Handtuch-Rouladen-Spiel. Begründung: Entry Barrier gleich null (jeder hat ein Handtuch), visuell extrem einfach darzustellen, harter Schnitt vom Sofa-Hook auf die Roulade-Action liefert sich praktisch von selbst. Auswahl-Kriterium ist nicht „welche Idee ist die coolste“, sondern „welche Idee hat den niedrigsten Reibungswiderstand zwischen Zuschauer und Nachmach-Aktion“.
Der Skripting-Prompt — vom Konzept zum Tabellen-Drehbuch
Hier verwandelst du eine Idee in einen konkreten Drehplan. Das Tabellenformat ist kein Stylechoice — es trennt Bild und Ton sauber und macht jeden Clip am Drehtag auf den ersten Blick produktionsreif.
Prompt 3 — Der Skripting-Prompt
Im selben Chat formulierst du: „Erstell mir aus Idee eins ein ausführliches Konzept in einer Tabelle mit den Spalten Zeit, Visuell, Text-Overlay und Voice-Over. Das Voice-Over soll exakt die gleiche kumpelhafte Tonalität haben wie das Referenzvideo.“ Wichtig sind beide Anweisungen: die Tabellenstruktur und der explizite Tonalitäts-Verweis. Ohne den zweiten Teil rutscht Gemini zurück in den neutralen Lehrbuch-Sprech.
Was rauskommt — vollständiges Drehbuch für Tag 02
- Zeit 00–04 s
- Visuell Du auf dem Sofa, draußen regnet es, resignierter Blick in die Kamera
- Overlay „30 Tage Indoor-Beschäftigung 2/30“
- Voice-Over „Draußen ist mal wieder Weltuntergang, aber der Hund hat trotzdem Energie für zehn?“
- Zeit 04–09 s
- Visuell Harter Schnitt, du wedelst mit einem alten Handtuch
- Overlay „Kosten: 0 €, Aufwand: 30 Sekunden“
- Voice-Over „Kein Stress, dafür braucht ihr echt nur ein olles Handtuch und das normale Futter.“
- Zeit 09–17 s
- Visuell POV von oben, Handtuch flach ausgebreitet, Hand streut Futter drauf
- Overlay „Schnüffel-Spaß für Anfänger“
- Voice-Over „Breitet das Ding flach aus, dann verteilt ihr das Futter einfach wahllos drauf.“
- Zeit 17–26 s
- Visuell Zeitraffer, stramme Roulade gerollt, Close-Up vom Knoten
- Overlay „Level 1: Roulade · Level 2: Knoten“
- Voice-Over „Jetzt wird gerollt. Wem das zu easy ist: Macht nen Knoten rein! Endgegner-Level.“
- Zeit 26–32 s
- Visuell Hund schnüffelt intensiv (ASMR-Sound), dann platt auf zerwühltem Handtuch
- Overlay „Nasenarbeit = Kopfarbeit“ · „Speichern für Regentage!“
- Voice-Over „Zehn Min Nasenarbeit ballern im Kopf mehr als ne Stunde Gassi. Folgt mir für Tag 3!“
Produktion und Iteration
Drei Prompts produzieren das Konzept. Die Produktion produziert das Video. Hier sind die Drehtipps, die zwischen einem Skript-treuen Clip und einem Algorithmus-Hit unterscheiden — und der Trick, mit dem Folge zwei bis zehn fast von selbst entstehen.
Drei Gründe, warum dieser Workflow funktioniert
- Stil-Konsistenz. Gemini versteht Slang, Tempo und Struktur des Originals — das Skript klingt wie der Creator, nicht wie eine KI. Voraussetzung: der Style-Decoder-Prompt aus Phase 02 wurde ausführlich genug formuliert.
- Serien-Denke. Anstatt nur ein Video zu planen, liefert Gemini direkt Futter für zehn oder mehr Teile. Du baust nicht ein Reel — du baust ein Format.
- Produktions-Reife. Die Tabelle trennt Bild und Ton — am Drehtag weißt du exakt, welche Shots du brauchst und welche Overlays in die Post-Production wandern.
Drei Drehtipps für das erste Video
- Hook zuerst und separat drehen. Wenn die ersten vier Sekunden im Take nicht zünden, sofort neu drehen — nicht später im Edit retten. Der Hook ist der einzige Beat, der zwingend funktionieren muss.
- Voice-Over in zwei Schritten. Erst wörtlich vom Skript ablesen (Sicherheits-Take), dann den gleichen Inhalt frei sprechen (Authentizitäts-Take). Im Edit wählen, welcher Take pro Beat besser zur Energie passt.
- B-Roll für den Build planen. Sekunde 09–17 lebt von visuellem Detail — Top-Down-POV, Close-Up, schnelle Cuts. Wer hier nur eine statische Einstellung dreht, verliert die Watchtime im mittleren Drittel.
Wie du Episode zwei bis zehn fast ohne neuen Prompt bekommst
Der mächtigste Teil dieses Workflows ist nicht der erste Prompt — es ist die Chat-Persistenz. Sobald du das erste Drehbuch hast, reicht in demselben Gemini-Chat die folgende Formulierung: „Jetzt bitte Skript für Idee drei.“ Gemini hat den Kontext, die Constraints und die Tonalität bereits gespeichert und liefert dir Tag 03 im exakt gleichen Tabellenformat. Tonalität bleibt konsistent, Strukturen wiederholen sich rhythmisch, der Algorithmus belohnt die Wiedererkennbarkeit.
Drei Folgen in einer Woche
- Brainstorming pro Folge: 60–90 Minuten
- Skript schreiben: ad hoc, oft im Schnitt entschieden
- Tonalität schwankt zwischen Folgen
- Save-Rate niedrig, weil Konzepte zu generisch
Zehn Folgen in einer Stunde
- Brainstorming entfällt — Gemini liefert die Ideen
- Skript steht als Tabelle, Voice-Over wörtlich vorbereitet
- Tonalität bleibt über alle Folgen konsistent
- Save-Rate hoch, weil Konzepte unter Constraints umsetzbar sind
Skalierung als System — die Content-Engine bauen
Ein einzelner Workflow ist gut. Ein System aus mehreren parallel laufenden Workflows ist der eigentliche Wettbewerbsvorteil. So machst du aus dem Gemini-Trick eine dauerhafte Content-Engine, die auch in sechs Monaten noch trägt.
Reverse-Engineering plus Creative Constraints plus Tabellen-Skripting funktioniert nicht nur für Hundetraining-Content. Das gleiche Drei-Prompt-Schema läuft 1:1 für Beauty-Tutorials, Recipe-Reels, Tech-Reviews, Travel-Hacks und Personal-Finance-Erklärvideos. Du brauchst pro Nische ein anderes Referenzvideo und andere Constraints — der Workflow bleibt identisch.
Drei Parallel-Schienen, die du als nächstes aufsetzen kannst
- Schiene 01 — Evergreen-TutorialsEine Referenz für eine Tutorial-Serie wählen, 10–15 Episoden vorproduzieren, in regelmäßigem Takt veröffentlichen. Save-Rate-getrieben, langlebig, immer wieder von Algorithmen ausgespielt.
- Schiene 02 — Trend-ReaktivEine wöchentlich gewechselte Referenz aus dem aktuellen Trend. Schneller Loop: Trend erkennen, Referenz analysieren, eigene Version in 48 Stunden produzieren. Reichweiten-Spike-getrieben.
- Schiene 03 — Brand-Story-SerienEine Referenz, die zur Tonalität einer Brand-Kooperation passt. Drei bis fünf Episoden, die das Brand-Narrativ in das erprobte Format einbetten. Conversion-getrieben.
Wie du die Engine messbar machst
Jede Serie braucht ein Reporting-Tail. Tracke pro Episode: Intro-Retention bei drei Sekunden, Completion-Rate, Replay-Rate, Save-Rate und Shares. Nach drei Episoden hast du Daten, welcher Beat in deiner Nische besonders gut funktioniert — und der nächste Loop beginnt: Schicke die Reporting-Daten zurück in Gemini, lass die Folge-Episoden auf diese Beats hin schärfen. Das ist der Punkt, an dem aus dem Trick ein System wird.
Virale Video-Konzepte mit Gemini — die wichtigsten Fragen kurz beantwortet
Brauche ich Gemini Pro oder reicht die kostenlose Version?
Ist es rechtlich okay, Konkurrenz-Videos zu analysieren?
Was, wenn Gemini eine generische oder schwache Idee liefert?
Wie lange dauert der gesamte Workflow von Referenzvideo bis erstem Dreh?
Funktioniert der Workflow auch für YouTube Shorts und nicht nur TikTok/Reels?
Kann ich den Workflow auch ohne Tabellen-Format nutzen?
Was du jetzt konkret tun kannst
- Suche ein virales TikTok- oder Reels-Video in deiner Nische und lade es über snapinsta.app als MP4 herunter.
- Öffne einen neuen Gemini-Chat, lade das Video als Datei-Anhang hoch und sende den Style-Decoder-Prompt aus Phase 02 auf den vier Ebenen Aufbau, Schnitt, Sprache und Inhalt.
- Definiere drei Creative Constraints für deine Serie — Nische, Budget, Aufwand — und sende den Scaling-Prompt für zehn Folge-Konzepte.
- Wähle die Idee mit der niedrigsten Entry Barrier aus und sende den Skripting-Prompt für ein vollständiges Tabellen-Drehbuch mit Zeit, Visuell, Text-Overlay und Voice-Over.
- Drehe das erste Video gegen die Tabelle — Hook separat zuerst, B-Roll für den Build, Voice-Over in zwei Takes.
- Nutze denselben Chat für Episode zwei bis zehn und lasse Reporting-Daten nach drei Episoden in den nächsten Loop zurückfließen.



