_Data_Analysis · SEO & GEO · 2026
SEO Data Analyst
Automatisierte Content-Cluster-Planung auf Basis echter Suchdaten. Keyword-Recherche, Wettbewerbsanalyse und Inhaltsplan in einem Durchlauf.
Content-Cluster-Planung beginnt in der Praxis fast immer gleich: Keyword-Tool öffnen, Begriffe exportieren, SERP manuell prüfen, Wettbewerber-Seiten durchscrollen, alles in ein Spreadsheet kippen, Struktur vorschlagen. Das dauert Stunden, ist schwer reproduzierbar und hängt stark davon ab, wie gründlich man an dem Tag arbeitet. Dieser Workflow macht daraus einen einzigen Durchlauf – mit denselben Datenquellen, die ein SEO-Stratege manuell nutzen würde, aber systematisch abgefragt und strukturiert aufbereitet.
Ein Content-Cluster-Entwurf für den österreichischen Markt. Kein fertiger Plan – ein Entwurf, den ein menschlicher Reviewer challengen, streichen und priorisieren soll. Pro vorgeschlagener Seite: Fokus-Keyword mit echtem Suchvolumen, ergänzende Keywords, Intent-Begründung, strategischer Winkel und – wo erkennbar – ein Content-Gap gegenüber dem stärksten Mitbewerber in der SERP. Jede Metrik ist mit einem Herkunfts-Tag versehen:
[DfS-Labs] Wert stammt aus der DataForSEO-Abfrage
[Schätzung] Keyword nicht in den Daten – vom LLM geschätzt
[abgeleitet] Interpoliert aus vorhandenen Werten
So sieht der Reviewer auf einen Blick, wo er den Zahlen vertrauen kann und wo nicht.
Wie der Workflow arbeitet
Ein Hauptthema als Freitexteingabe – das Seed-Keyword für die gesamte Analyse. Alle Ergebnisse beziehen sich auf den österreichischen Markt.
Ein einzelner API-Call an DataForSEO SERP Advanced liefert die komplette Suchergebnisseite: organische Ergebnisse, People Also Ask, Related Searches, AI Overview (inkl. zitierte Quellen), Featured Snippet, Knowledge Graph und alle aktiven SERP-Features. Ein Python-Extractor strukturiert die Antwort in separate Signale für den LLM-Prompt.
DataForSEO Labs liefert bis zu 700 semantisch verwandte Keywords mit echtem Suchvolumen, CPC, Keyword Difficulty und Intent-Tag. Daraus berechnet der Workflow die Intent-Verteilung über die Top-150-Keywords und klassifiziert die Saisonalität des Seed-Keywords anhand der Monatsdaten – von „evergreen" bis „extrem saisonal", mit Peak-Monat und Peak/Low-Verhältnis.
Jina Reader scrapt die organisch stärkste URL aus der SERP und liefert sauberes Markdown. Der Workflow extrahiert daraus Titel, Wortanzahl und die vollständige H1/H2/H3-Gliederung – das Grundgerüst, gegen das der LLM später Content-Gaps identifiziert.
Alle Signale fließen in einen LLM-Prompt mit strikten Provenance-Regeln: Das Modell darf keine Metrik ohne Herkunfts-Tag ausgeben. Es agiert als Senior SEO Data Analyst und ordnet Keywords aus der Tabelle den passenden Seitentypen zu – begründet mit Intent, Suchvolumen und Saisonalität. Welche Seitentypen vorgeschlagen werden, entscheidet die Datenlage: Eine Vergleichsseite erscheint nur, wenn Begriffe wie „Test" oder „vs." in den Keywords auftauchen. Eine Shop-Landingpage nur bei relevantem transaktionalem Anteil.
Was am Ende jedes Entwurfs steht
Marktcharakter-Kurzbefund
Was sagen Intent-Verteilung, Saisonalität, SERP-Features und Competitor-Typen über den Markt? In 3–4 Sätzen ein klares Bild, ob Ratgeber, Commerce oder Informationsportale dominieren.
AI-Visibility-Empfehlung
Wird ein Google AI Overview ausgespielt? Falls ja: welche Quellen werden zitiert und was heißt das für die GEO-Strategie. Falls nein: klare Aussage, dass GEO-Investitionen hier aktuell keinen Hebel haben.
Saisonalitäts-Klassifikation
Das Seed-Keyword wird anhand seiner Monatsdaten eingestuft – von „evergreen" bis „extrem saisonal", mit Peak-Monat und Peak/Low-Verhältnis. Damit der Reviewer weiß, ob der Content jetzt oder in drei Monaten live gehen sollte.
Content-Gap-Signal
2–3 konkrete Themen, die der stärkste Mitbewerber laut seiner Heading-Struktur nicht abdeckt – als Differenzierungschance, nicht als Garantie.
Datenqualitäts-Report
Wie viele Keywords im Entwurf aus echten Daten stammen, wie viele geschätzt wurden, und warum. Damit der Reviewer nicht raten muss, wie belastbar die Empfehlungen sind.
Reviewer-Hinweise
2–3 Punkte, die der Entwurf selbst als unsicher markiert – z. B. unklare Intents, Kannibalisierungsrisiken zwischen Seiten oder Related-Search-Begriffe, die eigene Cluster verdienen würden.
Technischer Hintergrund
Plattform
Dify im Workflow-Modus. 9 Knoten in linearer Pipeline: 1 Start, 4 Code-Knoten (Python 3), 3 HTTP-Requests und 1 LLM-Knoten.
Sprachmodell
Gemini 3.1 Pro (Google) via Dify-Plugin. Temperatur 0.3 für konsistente, strukturierte Ausgaben.
Datenquellen
Ausschließlich DataForSEO (SERP Advanced + Labs Keyword Suggestions) für den österreichischen Markt. Jina Reader für Competitor-Scraping.
Kosten pro Run
Ca. 0,10 EUR für DataForSEO + LLM-Kosten. Jeder Run liefert aktuelle Daten.
Logik
Python 3 in Dify-Code-Knoten: SERP-Parsing, Saisonalitäts-Klassifikation (Peak/Low-Ratio), Intent-Verteilung, Heading-Extraktion.
Fehlertoleranz
HTTP-Nodes mit Retry-Konfiguration. Code-Knoten fangen fehlende Felder ab und geben dem LLM strukturierte Fehlertexte statt leerer Daten.