E-Commerce-Markt
—
Daten- und Content-Markt
Wir messen E-Commerce üblicherweise in Bestellungen und Umsatz. Doch hinter jeder Bestellung steckt eine Infrastruktur: Attribute, Beschreibungen, Bilder, Formate, Übersetzungen und endlose Abstimmungsprozesse. Diese Seite erfasst das Ausmaß des Marktes in Zahlen und Prozessen.
Wie Sie diese Seite lesen sollten
Dieser Artikel ist bewusst ausführlich. Wir kürzen den Inhalt nicht auf „ein paar Thesen“, da sich das Ausmaß des Problems nur durch die Kombination von Zahlen, Ketten und operativen Effekten vollständig offenbart.
Wir beschreiben hier nicht, wie Lösungen und Technologien funktionieren. Dafür gibt es andere Seiten. Hier geht es um die Grundlagen: wie der Datenmarkt heute strukturiert ist und warum er in seiner jetzigen Form nicht mehr skalierbar ist.
Keine „Meinung“, sondern die beobachtbare Marktmechanik.
Wo Zeit verloren geht und Daten verloren gehen.
Warum dies eine systemische und keine lokale Aufgabe ist.
Umfang des Datenmarktes
Wie viele Akteure beteiligt sind
Weltweit gibt es etwa 28 Mio. Online-Shops. Davon sind rund 14 Mio. in den USA ansässig, und in Europa sind es mehrere Millionen (z.B. Großbritannien ≈ 1,1 Mio., Deutschland ≈ 0,7 Mio., Frankreich ≈ 0,6 Mio.).
Neben dem Einzelhandel sind Millionen von Herstellern und Lieferanten in die E-Commerce-Ketten involviert. Allein in Europa gibt es etwa 2,3 Mio. produzierende Unternehmen, die potenziell Produktdaten liefern.
Auch wenn das Produkt physisch dasselbe ist, vervielfältigt es sich digital: unterschiedliche Vertriebskanäle, unterschiedliche Anforderungen der Schaufenster, unterschiedliche Sprachen und Formate.
| Akteurtyp | Typischer Produktkatalog |
|---|---|
| Kleinunternehmen | 100–1 000 SKU |
| Der mittelständische Einzelhändler | 10 000–100 000 SKU |
| Große Einzelhändler | 100 000–500 000 SKU |
| Marktplätze | Hunderte Millionen SKUs |
Wie viele Informationseinheiten existieren
Wenn man Sprachen, Formate und Kanäle (Website, Marktplätze, Werbung, Feeds) berücksichtigt, beläuft sich die Anzahl der einzigartigen Einheiten von Produktinformationen (SKU × Sprache × Format × Kanal) auf Hunderte Milliarden Datenfragmente.
Zur Orientierung: Offene Kataloge wie Icecat enthalten 25+ Mio. Datenblätter in 77 Sprachen – dies veranschaulicht das Ausmaß mehrsprachiger Versionen.
Content-Flusskette
Wo Daten verloren gehen
Produktinformationen gelangen selten direkt vom Hersteller zum Käufer. Die typische Kette lautet: Hersteller → Distributor → Lieferant → Shop → CMS → Marketing.
In jeder Phase werden Daten transformiert, Formate ändern sich, Informationen gehen verloren oder werden manuell umgeschrieben. Wenn der Hersteller etwa 20 Attribute festgelegt hat, schaffen es oft nur 10–15 bis zum Frontend.
Erstellt die Quelldaten: Attribute, Artikelnummern, Bilder. Oft nur in einer Sprachversion und nach internen Standards.
Überträgt Daten in eigene Vorlagen, fügt Felder hinzu (Bestände/Codes), verliert Marketingdetails, ändert das Format.
Importiert in die eigene Struktur, fügt SEO und Kategorien hinzu. Bei manueller Arbeit entstehen Tippfehler, Auslassungen und Inkonsistenzen.
Erfordern separate Feeds und Formatbeschränkungen. Jede Abweichung führt dazu, dass das Produkt nicht im Kanal erscheint oder Fehler auftreten.
Kosten des Content-Prozesses
Manuelle Arbeit
Im Massen-E-Commerce dauert die Bearbeitung einer einzelnen Produktkarte ohne Automatisierung typischerweise 5–20 Minuten, wobei die direkten Selbstkosten im Bereich von $1–5 liegen. Es gibt zwar auch komplexe Kategorien, aber dieser Bereich ist typisch für den Datenstrom.
Schlechte Datenqualität führt zu messbaren Verlusten: 15–25% des Umsatzes gehen durch fehlerhaften Content verloren; bis zu 25% der Retouren sind auf Nichterfüllung der Erwartungen zurückzuführen.
Kleine Unternehmen und Großkonzerne
Ein Problem – unterschiedliche Möglichkeiten
Großunternehmen können Lieferanten Formate aufzwingen und in Infrastruktur investieren. Kleine und mittlere Unternehmen müssen sich hingegen oft an eingehende Daten anpassen und ihr Sortiment einschränken, weil sie den Content nicht verarbeiten können.
- stellen Anforderungen an Lieferanten
- investieren in PIM und Integrationen
- unterhalten Teams für Datenqualität
- verkraften Fehler durch Skalierung
- arbeitet in Lieferantenformaten
- hat kein Budget für Infrastruktur
- reduziert das Sortiment aufgrund von Inhalten
- veröffentlicht unvollständige Artikel 'as is'
Lieferanten als systemische Engpässe
Der Lieferant – der Ausgangspunkt der Inhalte
Lieferanten und Hersteller sind die ursprüngliche Quelle von Produktinformationen: Spezifikationen, Artikelnummern, Bilder, Verpackung, Zertifikate und technische Beschreibungen. Doch die Existenz von Daten bedeutet nicht deren Marktreife: Daten sind selten von Grund auf so strukturiert, dass sie die gesamte Kette bis zum Frontend ohne Verluste durchlaufen können.
In der Logistik gibt es Standards und Rollen (Spediteur, Lager, Fulfillment). In den Daten fehlen oft sowohl Standards als auch ein „Netzwerkbetreiber“: Der Lieferant muss ohne die entsprechende Infrastruktur sowohl der Erzeuger als auch der Integrator der Daten sein.
Vielfalt der Formate und Wahrheitsquellen
Für dasselbe Sortiment existieren beim Lieferanten oft mehrere parallele Quellen: Ein Teil der Daten liegt im ERP, ein Teil in Tabellen, ein Teil in PDFs, ein Teil in E-Mails und Abstimmungen. Für den Einzelhandel resultiert dies in ständigen „Nachbesserungen“, Validierungen und manuellen Korrekturen.
Codes, Bestände, Verpackungsinformationen, einige Attribute.
Kundenspezifische Vorlagen, manuelle Korrekturen.
Marketingtexte und technische Spezifikationen.
Klarstellungen, fehlende Bilder, Ausnahmen.
Nicht standardisierte Attribute
Lieferanten stimmen ihre Daten in der Regel nicht auf ein einheitliches Marktschemata ab. Sie liefern, was sie haben: ihre eigenen Feldnamen, unterschiedliche Maßeinheiten, verschiedene Detailgrade. Daher erfolgt die „Standardisierung“ faktisch auf Seiten des Einzelhändlers oder Marktplatzes.
| Eine Bedeutung | Wie in den Daten vorhanden | Was der Einzelhandel tut |
|---|---|---|
| Farbe | Color / Colour / Col / Farbe / Nuance | Ordnet zu, normalisiert |
| Größe | Größe / Abmessungen | Standardisiert Einheiten und Formate |
| Material | Material / Zusammensetzung | Erstellt Wertetabellen |
Ein Lieferant – bis zu 5–10 Formate
In der Praxis muss ein Lieferant, der mit vielen Partnern zusammenarbeitet, **bis zu 5–10 verschiedene Vorlagen** und Attributsysteme pflegen. Danach steigen die Wartungskosten schneller als der Nutzen – und der Lieferant senkt entweder die Qualität oder weicht auf Zwischenhändler aus und verliert die Kontrolle.
Manueller Support und seltene Updates.
Das Risiko von Fehlern und Desynchronisation steigt.
Zwischenhändler und Kontrollverlust treten auf.
Warum sich ein Lieferant nicht „an alle anpassen“ kann
Die Gründe liegen meist nicht in mangelnder Bereitschaft, sondern in der Prozessökonomie: Die Unterstützung zahlreicher Formate wird zu einem eigenen Produkt. Im Folgenden finden Sie typische Einschränkungen.
Daten sind auf verschiedene Quellen verteilt ▾
ERP-Systeme, Preislisten, Dateien, Kataloge und Kommunikation sind selten in einer einzigen Struktur zusammengeführt – eine „Single Source of Truth“ fehlt.
Zu viele Ausnahmen pro Kategorie ▾
Unterschiedliche Kategorien erfordern unterschiedliche Detailtiefe und Attribute; eine universelle „One-Size-Fits-All“-Vorlage existiert nicht.
Begrenzte IT-Ressourcen und Prioritäten ▾
Für viele Lieferanten ist „Content“ ein nachrangiger Prozess im Vergleich zu Produktion und Vertrieb, weshalb er keine systematischen Investitionen erhält.
Wachsende Kundenzahl vervielfacht die Update-Kosten ▾
Jedes Update wird zu einer Kette von E-Mails und Korrekturen über zahlreiche Vorlagen; Desynchronisation wird zur Norm.
Von den „Rohdaten“ zum Schaufenster – durch Verluste und Kopien
Fazit des Abschnitts
Lieferanteninhalte sind der „Rohstoff“ des E-Commerce. Der Markt behandelt sie wie ein fertiges Produkt, obwohl zwischen dem Rohstoff und der digitalen Auslage eine Transformationsschicht liegt: Glossare, Normalisierung, Lokalisierung, Qualitätskontrolle und Aktualisierungen.
Solange diese Schicht als Infrastruktur fehlt, baut jeder Marktteilnehmer sie selbst – und deshalb wird das Problem nicht lokal gelöst.
- neutrale Schicht der Datentransformation
- einheitliche Attribute- und Einheiten-Wörterbücher
- Automatisierung von Updates und Qualitätssicherung
Was diese Zahlen aussagen
1) Content ist Logistik, aber ohne die Industrie
Im E-Commerce sind Geld und Logistik längst industrialisiert. Produktdaten werden jedoch immer noch manuell, fragmentiert und mit Verlusten in Dutzenden von Versionen und Formaten übertragen.
2) Das Problem ist systemisch – und lässt sich daher nicht „innerhalb eines Unternehmens“ lösen
Jeder Akteur ist gezwungen, seine eigene Datenschicht für Transformationen aufzubauen: Attributabgleich, Normalisierung, Qualitätskontrolle, Lokalisierung, Feeds. Dies skaliert jedoch nicht auf Marktebene – die Arbeit wird von Tausenden von Unternehmen parallel dupliziert.
3) Die Kluft zwischen Groß und Klein vergrößert sich
Große Player können Lieferanten ein Format aufzwingen und in Infrastruktur investieren. Kleinere Unternehmen müssen oft 'as is' veröffentlichen, ihr Sortiment reduzieren und an Effizienz verlieren, weil sie den Content-Fluss nicht verarbeiten können.
Deshalb liefern Einzellösungen keinen Skaleneffekt, ein Ökosystem-Ansatz hingegen schon.
Alle Werte auf dieser Seite sind Schätzungen der Größenordnungen und typische Bandbreiten für den internationalen Markt. Sie können je nach Land und Kategorie variieren, aber die allgemeine Marktdynamik (Duplizierung, Verluste, manueller Aufwand) bleibt unverändert.