_Data_Analysis · SEO & GEO · 2026

SEO Data Analyst

Automatisierte Content-Cluster-Planung auf Basis echter Suchdaten. Keyword-Recherche, Wettbewerbsanalyse und Inhaltsplan in einem Durchlauf.

✉ Demo anfragen

Problem Warum dieser Workflow existiert

Content-Cluster-Planung beginnt in der Praxis fast immer gleich: Keyword-Tool öffnen, Begriffe exportieren, SERP manuell prüfen, Wettbewerber-Seiten durchscrollen, alles in ein Spreadsheet kippen, Struktur vorschlagen. Das dauert Stunden, ist schwer reproduzierbar und hängt stark davon ab, wie gründlich man an dem Tag arbeitet. Dieser Workflow macht daraus einen einzigen Durchlauf – mit denselben Datenquellen, die ein SEO-Stratege manuell nutzen würde, aber systematisch abgefragt und strukturiert aufbereitet.

Ergebnis Was am Ende rauskommt

Ein Content-Cluster-Entwurf für den österreichischen Markt. Kein fertiger Plan – ein Entwurf, den ein menschlicher Reviewer challengen, streichen und priorisieren soll. Pro vorgeschlagener Seite: Fokus-Keyword mit echtem Suchvolumen, ergänzende Keywords, Intent-Begründung, strategischer Winkel und – wo erkennbar – ein Content-Gap gegenüber dem stärksten Mitbewerber in der SERP. Jede Metrik ist mit einem Herkunfts-Tag versehen:

[DfS-Labs] Wert stammt aus der DataForSEO-Abfrage [Schätzung] Keyword nicht in den Daten – vom LLM geschätzt [abgeleitet] Interpoliert aus vorhandenen Werten

So sieht der Reviewer auf einen Blick, wo er den Zahlen vertrauen kann und wo nicht.

Wie der Workflow arbeitet

Phase 1 Eingabe

Ein Hauptthema als Freitexteingabe – das Seed-Keyword für die gesamte Analyse. Alle Ergebnisse beziehen sich auf den österreichischen Markt.

Phase 2 SERP-Analyse

Ein einzelner API-Call an DataForSEO SERP Advanced liefert die komplette Suchergebnisseite: organische Ergebnisse, People Also Ask, Related Searches, AI Overview (inkl. zitierte Quellen), Featured Snippet, Knowledge Graph und alle aktiven SERP-Features. Ein Python-Extractor strukturiert die Antwort in separate Signale für den LLM-Prompt.

DataForSEO SERP Advanced AI Overview & Quellen Featured Snippet Knowledge Graph PAA & Related Searches

Phase 3 Keyword-Universum

DataForSEO Labs liefert bis zu 700 semantisch verwandte Keywords mit echtem Suchvolumen, CPC, Keyword Difficulty und Intent-Tag. Daraus berechnet der Workflow die Intent-Verteilung über die Top-150-Keywords und klassifiziert die Saisonalität des Seed-Keywords anhand der Monatsdaten – von „evergreen" bis „extrem saisonal", mit Peak-Monat und Peak/Low-Verhältnis.

DataForSEO Labs (Keyword Suggestions) MSV · CPC · KD · Intent Saisonalitäts-Klassifikation Intent-Verteilung (Top 150)

Phase 4 Competitor-Deep-Scrape

Jina Reader scrapt die organisch stärkste URL aus der SERP und liefert sauberes Markdown. Der Workflow extrahiert daraus Titel, Wortanzahl und die vollständige H1/H2/H3-Gliederung – das Grundgerüst, gegen das der LLM später Content-Gaps identifiziert.

Jina Reader (Top-1 URL) Heading-Extraktion (H1–H3) Wortanzahl & Strukturanalyse

Phase 5 Synthese & Cluster-Entwurf

Alle Signale fließen in einen LLM-Prompt mit strikten Provenance-Regeln: Das Modell darf keine Metrik ohne Herkunfts-Tag ausgeben. Es agiert als Senior SEO Data Analyst und ordnet Keywords aus der Tabelle den passenden Seitentypen zu – begründet mit Intent, Suchvolumen und Saisonalität. Welche Seitentypen vorgeschlagen werden, entscheidet die Datenlage: Eine Vergleichsseite erscheint nur, wenn Begriffe wie „Test" oder „vs." in den Keywords auftauchen. Eine Shop-Landingpage nur bei relevantem transaktionalem Anteil.

Gemini 3.1 Pro (Temperatur 0.3) Provenance-Tagging Reviewer-Entwurf

Was am Ende jedes Entwurfs steht

Marktcharakter-Kurzbefund

Was sagen Intent-Verteilung, Saisonalität, SERP-Features und Competitor-Typen über den Markt? In 3–4 Sätzen ein klares Bild, ob Ratgeber, Commerce oder Informationsportale dominieren.

AI-Visibility-Empfehlung

Wird ein Google AI Overview ausgespielt? Falls ja: welche Quellen werden zitiert und was heißt das für die GEO-Strategie. Falls nein: klare Aussage, dass GEO-Investitionen hier aktuell keinen Hebel haben.

Saisonalitäts-Klassifikation

Das Seed-Keyword wird anhand seiner Monatsdaten eingestuft – von „evergreen" bis „extrem saisonal", mit Peak-Monat und Peak/Low-Verhältnis. Damit der Reviewer weiß, ob der Content jetzt oder in drei Monaten live gehen sollte.

Content-Gap-Signal

2–3 konkrete Themen, die der stärkste Mitbewerber laut seiner Heading-Struktur nicht abdeckt – als Differenzierungschance, nicht als Garantie.

Datenqualitäts-Report

Wie viele Keywords im Entwurf aus echten Daten stammen, wie viele geschätzt wurden, und warum. Damit der Reviewer nicht raten muss, wie belastbar die Empfehlungen sind.

Reviewer-Hinweise

2–3 Punkte, die der Entwurf selbst als unsicher markiert – z. B. unklare Intents, Kannibalisierungsrisiken zwischen Seiten oder Related-Search-Begriffe, die eigene Cluster verdienen würden.

Technischer Hintergrund

Plattform

Dify im Workflow-Modus. 9 Knoten in linearer Pipeline: 1 Start, 4 Code-Knoten (Python 3), 3 HTTP-Requests und 1 LLM-Knoten.

Sprachmodell

Gemini 3.1 Pro (Google) via Dify-Plugin. Temperatur 0.3 für konsistente, strukturierte Ausgaben.

Datenquellen

Ausschließlich DataForSEO (SERP Advanced + Labs Keyword Suggestions) für den österreichischen Markt. Jina Reader für Competitor-Scraping.

Kosten pro Run

Ca. 0,10 EUR für DataForSEO + LLM-Kosten. Jeder Run liefert aktuelle Daten.

Logik

Python 3 in Dify-Code-Knoten: SERP-Parsing, Saisonalitäts-Klassifikation (Peak/Low-Ratio), Intent-Verteilung, Heading-Extraktion.

Fehlertoleranz

HTTP-Nodes mit Retry-Konfiguration. Code-Knoten fangen fehlende Felder ab und geben dem LLM strukturierte Fehlertexte statt leerer Daten.