Wie LLMs entscheiden, welche Quellen sie zitieren

Was ChatGPT, Claude und Perplexity aus einer Website tatsächlich lesen – und warum saubere schema.org-Annotationen mehr bewegen als der dritte Hero-Slider.

Wenn ein potenzieller Kunde heute „beste WordPress-Agentur in Berlin" in ChatGPT oder Claude eingibt, läuft hinter der Antwort eine Pipeline ab, die mit klassischer SEO wenig zu tun hat. Das Modell ruft keine Position-Eins ab. Es liest eine Handvoll Seiten, extrahiert verifizierbare Aussagen und entscheidet, welche davon sich zitieren lassen, ohne dass jemand widerspricht. Wer in dieser Pipeline auftaucht, hat die Lobby besser gebaut – nicht das Schlagwort öfter wiederholt.

Was ein LLM tatsächlich liest

Die einfache Antwort: viel weniger, als die Seite anzeigt. Hero-Carousels, animierte Hintergründe, Marketing-Floskeln – das alles passiert in einem visuellen Layer, der für ein Sprachmodell unsichtbar ist. Was zählt, ist die strukturierte Schicht darunter: <script type="application/ld+json">-Blöcke, semantische Überschriften, Absätze mit klaren Aussagen, eine erreichbare /llms.txt am Site-Root.

Konkret: Wenn ein Modell prüft, ob eine Agentur als Antwort taugt, sucht es nach maschinenlesbaren Signalen für drei Dinge – Identität (wer ist das?), Belegbarkeit (woran lässt sich die Aussage festmachen?) und Aktualität (ist das noch frisch?). Fehlt einer dieser Bausteine, fällt die Seite aus der Antwort heraus – auch dann, wenn sie inhaltlich besser ist als die Konkurrenz.

Die drei Schichten, die zählen

1. Identität: schema.org Organization

Ohne eine vollständige Organization-Annotation – mit name, founder, foundingDate, address, contactPoint und einem sameAs-Array, das zu echten externen Profilen verlinkt – kann ein LLM nicht einordnen, ob die Website hinter der Aussage eine reale, überprüfbare Entität repräsentiert. Der häufigste Fehler: ein Logo und ein Firmenname, aber keine strukturierten Daten. Die häufigste Lösung: ein einziger Liquid- oder Twig-Edit am Layout-Template, der das gesamte Site überdeckt.

2. Belegbarkeit: Citation und sameAs

LLMs zitieren bevorzugt Aussagen, die sich mit einer externen Quelle abgleichen lassen. Wer behauptet, „seit 2019 spezialisiert auf WordPress-Migrationen", aber kein Handelsregister-Eintrag, kein LinkedIn-Profil und kein älterer Blogbeitrag das stützt, ist für das Modell eine unverankerte Aussage. Eine gepflegte sameAs-Liste auf der Organization-Node und konkrete citation-Felder auf Article-Nodes ändern das.

3. Aktualität: dateModified und /llms.txt

Modelle wie ChatGPT mit Websuche und Perplexity gewichten frische Inhalte messbar höher. Ein präzises dateModified auf jeder Seite – nicht das Build-Datum, sondern die echte letzte inhaltliche Änderung – signalisiert, dass die Aussage noch gilt. Eine /llms.txt am Root, die in 15 Zeilen erklärt, worum es auf der Seite geht, ersetzt für KI-Crawler den Versuch, dasselbe aus 40 verschachtelten Templates herauszupuzzeln.

Was Sie diese Woche tun können

  1. Die Organization-JSON-LD vollständig befüllen: founder mit echtem Personen-Node, foundingDate aus dem Handelsregister, mindestens drei sameAs-URLs zu externen Profilen, ein contactPoint mit E-Mail und Telefon.
  2. Eine /llms.txt publizieren – 10 bis 15 Zeilen reichen. Wer Sie sind, was Sie anbieten, wo Sie tätig sind, welche Aussagen über Sie woanders nachzulesen sind.
  3. Auf jeder relevanten Seite dateModified aus dem tatsächlichen Änderungsdatum lesen, nicht hartcodieren.
  4. Eine reale FAQ-Page mit FAQPage-Schema einbauen. Modelle ziehen FAQ-Antworten überproportional gern als Zitate.

Das ist kein Hexenwerk und kein Quartalsprojekt. Drei der vier Punkte sind ein Liquid- oder Twig-Edit. Der Effekt ist – pro Stunde investierter Arbeit – größer als jede SEO-Maßnahme, die zwischen 2010 und 2022 funktioniert hat.

Was wir bei Audits regelmäßig sehen

In jedem AI-Visibility-Audit, das wir bei Digital Domination durchführen, ist mindestens einer der drei Punkte unfertig. Häufig fehlt die /llms.txt komplett. Häufig steht im founder-Feld der Markenname statt einer Person. Häufig zeigt der dateModified-Stempel den Tag des letzten Deploys statt der letzten inhaltlichen Änderung. Jeder dieser Punkte ist ein eigener Hebel. Zusammen entscheiden sie, ob das Modell die Seite als Quelle akzeptiert oder als Marketing-Rauschen wegfiltert. Und weil diese Signale sich nur auszahlen, wenn die Engines tatsächlich ändern, was sie über Sie sagen, lohnt der Blick auf das Ergebnis, nicht nur auf das Markup – wir haben Cited gebaut, um zu beobachten, wie die fünf Engines eine Marke über die Zeit beschreiben, sodass sich eine Schema- oder /llms.txt-Korrektur damit verknüpfen lässt, ob sich die Zitierungen wirklich bewegen.