Fünf Märkte statt eines
Der Beitrag „Sprache und Geografie der Sichtbarkeit“ erläutert die Mechanismen, über die Sprache auf Sichtbarkeit wirkt. Hier schauen wir von der anderen Seite darauf — von den Daten zur Schlussfolgerung: Was genau geschieht mit einer konkreten Marke und ihren Wettbewerbern, wenn die Sprache wechselt.
Wir haben Notion gewählt — ein weltweit bekanntes Produkt für Produktivität. Ganz bewusst: Wir brauchten eine Marke, die das Modell sicher kennt, um die Erklärung „es gibt einfach zu wenig Daten“ auszuschließen. Fünf Ausführungen, fünf Sprachen, ein Modell, ein Korpus von Szenarien.
Der Score von Notion schwankte moderat: von 62.9 im Französischen bis 75.7 im Deutschen, eine Spanne von 12.8 Punkten. Die Konfidenzintervalle der Ausführungen überlappen sich teilweise. Hätten wir an dieser Stelle aufgehört, wäre das Fazit gelassen ausgefallen: „kleinere Schwankungen, möglicherweise Modellrauschen“.
Dann haben wir auf die Wettbewerber geschaut.
Konkurrenzmatrix: der zentrale Beleg
| Marke | RU | EN | ES | FR | DE | Spanne |
|---|---|---|---|---|---|---|
| Notion (Zielmarke) | 71.2 | 68.8 | 69.1 | 62.9 | 75.7 | 12.8 |
| Slack | 0.0 | 51.0 | 53.8 | 54.3 | 54.9 | 54.9 |
| Monday.com | 47.4 | 30.5 | 29.0 | 7.8 | 13.0 | 39.5 |
| Asana | 70.1 | 52.6 | 51.1 | 39.7 | 59.1 | 30.4 |
| Microsoft Copilot | 36.2 | 39.9 | 42.8 | 51.1 | 24.8 | 26.3 |
| ClickUp | 67.3 | 59.6 | 63.1 | 54.5 | 62.7 | 12.8 |
| Coda | 46.0 | 46.7 | 38.4 | 41.1 | 43.6 | 8.2 |
| Airtable | 33.5 | 37.5 | 30.5 | 28.3 | 40.4 | 12.1 |
| Confluence | 22.3 | 13.2 | 16.6 | 24.0 | 20.6 | 10.8 |
Die Spanne bei Notion beträgt 12.8. Bei Slack sind es 54.9. Bei Monday.com 39.5. Bei Asana 30.4. Das sind fünf verschiedene Wettbewerbslandschaften, zusammengeführt in einer einzigen Tabelle.
Drei Muster, die wir gesehen haben
Binäres Verschwinden: Slack
Im Russischen erhält Slack einen Score von 0.0 — das Modell erwähnt es im Kontext von Produktivität und Workspace-Tools überhaupt nicht. In den vier übrigen Sprachen ist das Ergebnis stabil: 51–55 Punkte, eine Spanne von nur 3.8 Punkten. Diese Stabilität in vier Sprachen bei vollständigem Nullwert in der fünften ist ein starkes Argument dafür, dass es sich um eine stabile Eigenschaft des russischsprachigen Visibility Language Field handelt und nicht um einen zufälligen Ausreißer.
Die wahrscheinlichste Erklärung liegt in den Trainingsdaten: Slack wird in englisch-, französisch- und deutschsprachigen Quellen aktiv als Tool für Teamarbeit diskutiert. In russischsprachigen Quellen hingegen nahezu gar nicht. Das Modell hat sein Wissen über Slack nicht verloren; es hat es in diesem Kontext nie erworben.
Gradient des Verschwindens: Monday.com
Monday.com zeigt einen gleitenden Rückgang von 47.4 im Russischen auf 7.8 im Französischen. Das ist ein drittes Muster, das sich sowohl von der Stabilität bei Notion als auch vom binären Umschalten bei Slack unterscheidet. Die Marke scheint beim Übergang zwischen den Visibility Language Fields zu verblassen — sie bleibt präsent, verliert aber an Gewicht.
Inversion: Microsoft Copilot
Dort, wo Notion am stärksten ist (Deutsch — 75.7), ist Copilot am schwächsten (24.8). Im Französischen ist das Bild umgekehrt: Notion 62.9, Copilot 51.1. Die beiden Marken scheinen auf einer Wippe zu sitzen, und die Sprache entscheidet, wer oben landet. Nach unseren Beobachtungen könnte das mit der Aktivität von Microsoft auf frankophonen europäischen Märkten zusammenhängen — für eine belastbare Aussage reichen die Daten jedoch nicht aus.
Das Wissen ist stabil, die Empfehlung nicht
Eine unabhängige Analyse unserer Daten zeigte ein Muster, das womöglich noch wichtiger ist als die Konkurrenzmatrix selbst.
Wenn die Marke im prompt bereits genannt wurde (diagnostischer Modus), antwortete das Modell über sie in allen Sprachen gleich stabil: 73–79 Punkte, Variationskoeffizient 3.7%. Das Modell kennt Notion auf Russisch, Französisch und Deutsch gleichermaßen gut.
Die Unterschiede beginnen, wenn der Nutzer den Markennamen noch nicht genannt hat. Die durchschnittliche Position in der Antwort, die Aufnahme in die Top 3, die Zitation der Domain notion.so — all das hängt stark von der Sprache ab. Im Russischen wird notion.so in 24.5% der Antworten zitiert, im Deutschen in 21.4%, im Französischen in 0%.
Für die Marke ist das ein unbequemer Befund: Das Wissen des Modells über Ihre Marke ist eine notwendige, aber keine hinreichende Bedingung. Entscheidend ist, ob Sie in die engere Auswahl kommen, wenn der Nutzer Ihren Namen noch nicht ausgesprochen hat. Die Antwort darauf hängt von der Sprache ab.
Drei Mechanismen, die wir vermuten
Wir sehen drei Kanäle, über die Sprache das Konkurrenzset neu ordnet. Alle drei sind Hypothesen, die durch die Daten dieser Ausführungen gestützt, experimentell aber nicht validiert sind.
Der erste ist die Asymmetrie der Trainingskorpora. Das Modell wurde auf Texten trainiert, in denen unterschiedliche Marken in verschiedenen Sprachen mit unterschiedlicher Häufigkeit besprochen werden. Russischsprachige Texte über Produktivität erwähnen Slack fast nie; englischsprachige erwähnen es ständig.
Der zweite sind unterschiedliche Web-Quellen. Im Web-Modus sucht das Modell in der Sprache der Anfrage und findet andere Übersichten, Vergleiche und Rankings — mit jeweils anderer Markenzusammensetzung. Die französische Suche liefert französische Quellen, in denen Notion zwar bekannt ist, notion.so aber nicht zitiert wird.
Der dritte sind unterschiedliche assoziative Graphen der Kategorie. In jeder Sprache konstruiert das Modell seine eigene Karte der Kategorie „Produktivität“. Auf Russisch sind das Notion, Asana, ClickUp, Monday.com. Auf Französisch Notion, Slack, Microsoft Copilot, ClickUp. Die Zusammensetzung der Akteure unterscheidet sich — und das bestimmt, wer in die Empfehlung gelangt.
Was das in der Praxis bedeutet
Für die kategorieführende Marke ist VLF eher eine strategische Aufgabe als eine Krise. Ihr eigener Score schwankt moderat, die Wettbewerber, mit denen Sie in einer Sprache konkurrieren, können in einer anderen andere sein. Eine Strategie, die um ein einziges Konkurrenzset herum gebaut wurde, riskiert, auf dem benachbarten Sprachmarkt irrelevant zu werden.
Für eine Marke, die keine dominante Position hat, ist die Lage härter. Monday.com verliert beim Wechsel vom Russischen ins Französische 40 Punkte. Slack verschwindet im Russischen vollständig. Wenn Ihre Marke auf Rang zwei oder drei liegt, ist VLF ein direktes Geschäftsrisiko: Sichtbarkeit, die in einer Sprache erarbeitet wurde, überträgt sich nicht automatisch auf eine andere.
Die praktische Empfehlung ist einfach: Führen Sie in jeder Sprache des Zielmarkts eine eigene Studie durch. Vergleichen Sie nicht nur Ihren eigenen Score, sondern auch die Zusammensetzung des Konkurrenzsets. Eine Strategie zum Ausbau der Sichtbarkeit muss die konkreten Wettbewerber berücksichtigen, die in jeder Sprache tatsächlich existieren — denn das können in verschiedenen Sprachen unterschiedliche Unternehmen sein.
Methodische Anmerkungen
Die Daten stammen aus fünf Ausführungen einer Marke (Notion) auf dem Modell GPT-5.4. Alle Ausführungen verwendeten das standardisierte AI100-Korpus mit 200 Szenarien. Zwei Ausführungen (RU und FR) wurden am 2. April durchgeführt, drei (EN, DE, ES) am 3. April 2026. Unterschiede zwischen den Tagen (day effect) wurden nicht vom Spracheffekt getrennt.
Die Konfidenzintervalle der finalen Scores überlappen sich teilweise. Der Cochran-Q-Test schätzt die Wahrscheinlichkeit, dass die gesamte Streuung durch Modellrauschen erklärt wird, auf 4–8% — an der Grenze statistischer Signifikanz. Die strukturellen Muster — die Stabilität von Slack in vier Sprachen bei Null in der fünften, der Gradient von Monday.com, die Inversion von Copilot — lassen sich durch Stochastik jedoch nur schlecht erklären.
Die zentrale Einschränkung lautet: eine Marke, ein Modell, eine Kategorie, je eine Ausführung pro Sprache. Für eine vollständige Validierung braucht es Wiederholungsausführungen (mindestens 5 pro Sprache) und Tests mit anderen Marken und anderen Modellen. Wir nennen diese Beobachtung VLF und halten sie für ausreichend fundiert, um sie zu veröffentlichen, aber nicht für hinreichend validiert für abschließende Schlussfolgerungen.
Was wahrscheinlich bleibt oder von der Plattform abhängt
Eine Marke, ein Modell, je eine Ausführung pro Sprache — das reicht nicht aus, um Aussagen über die Größenordnung des Effekts in anderen Kategorien und auf anderen Modellen zu treffen. Die genaue Grenze zwischen Spracheffekt und stochastischem Modellrauschen ist bislang nicht gezogen.
Bei einem Wechsel der Sprache der prompts wird das Konkurrenzset einer Marke neu geordnet: einige Wettbewerber erscheinen, andere verschwinden, dritte verändern ihre Position radikal. Das diagnostische Wissen des Modells über die Marke bleibt dabei stabil — es verändert sich gerade die Empfehlungsschicht.
Eine internationale Marke muss ihre Sichtbarkeit in jeder Sprache des Zielmarkts separat testen. Das Ergebnis einer englischsprachigen Ausführung lässt sich nicht auf andere Sprachen übertragen — insbesondere nicht bei Marken, die keine unangefochtenen Kategorieführer sind.