Marktzahlen • E-Commerce als Datenmarkt

E-Commerce-Markt

Daten- und Content-Markt

Wir messen E-Commerce üblicherweise in Bestellungen und Umsatz. Doch hinter jeder Bestellung steckt eine Infrastruktur: Attribute, Beschreibungen, Bilder, Formate, Übersetzungen und endlose Abstimmungsprozesse. Diese Seite erfasst das Ausmaß des Marktes in Zahlen und Prozessen.

Wichtige Kennzahlen
Größenordnungen
28 Mio+
Onlineshops weltweit
14 Mio
davon in den USA
350–600 Mio
SKUs bei Marktführern
15–25%
Verluste durch Datenfehler
Ein SKU wird zu Dutzenden von Datenversionen: Vertriebskanäle, Sprachen, Formate, Anforderungen der Plattformen.

Wie Sie diese Seite lesen sollten

Dieser Artikel ist bewusst ausführlich. Wir kürzen den Inhalt nicht auf „ein paar Thesen“, da sich das Ausmaß des Problems nur durch die Kombination von Zahlen, Ketten und operativen Effekten vollständig offenbart.

Wir beschreiben hier nicht, wie Lösungen und Technologien funktionieren. Dafür gibt es andere Seiten. Hier geht es um die Grundlagen: wie der Datenmarkt heute strukturiert ist und warum er in seiner jetzigen Form nicht mehr skalierbar ist.

Ansatz
Zahlen + Prozesse

Keine „Meinung“, sondern die beobachtbare Marktmechanik.

Fokus
Content-Logistik

Wo Zeit verloren geht und Daten verloren gehen.

Ergebnis
Das Verständnis des Ausmaßes

Warum dies eine systemische und keine lokale Aufgabe ist.

In den kommenden Jahren werden die Kosten für die Veröffentlichung eines Produkts online die Kosten für dessen physische Lieferung erreichen und diese dann übersteigen. Die Logistik wird seit Jahrzehnten optimiert, während die Content-Logistik immer noch manuell und fragmentiert ist.
Abschnitt 1

Umfang des Datenmarktes

Wie viele Akteure beteiligt sind

Weltweit gibt es etwa 28 Mio. Online-Shops. Davon sind rund 14 Mio. in den USA ansässig, und in Europa sind es mehrere Millionen (z.B. Großbritannien ≈ 1,1 Mio., Deutschland ≈ 0,7 Mio., Frankreich ≈ 0,6 Mio.).

Neben dem Einzelhandel sind Millionen von Herstellern und Lieferanten in die E-Commerce-Ketten involviert. Allein in Europa gibt es etwa 2,3 Mio. produzierende Unternehmen, die potenziell Produktdaten liefern.

Weltweit
≈ 28 Mio
E-Commerce-Seiten
USA
≈ 14 Mio
etwa 50 % der Welt
Europa
Millionen
UK 1,1 / DE 0,7 / FR 0,6
Infografik: Shops nach Regionen (ungefähre Angaben)
Maßstab ist symbolisch
USA
≈ 14 Mio
Europa
≈ 5–7 Mio
Rest der Welt
≈ 7–9 Mio
*Europa und der Rest der Welt sind grobe Schätzungen der Verteilung, da verschiedene Quellen Websites unterschiedlich aggregieren.
Der entscheidende Skaleneffekt
1 SKU → Dutzende Datenversionen

Auch wenn das Produkt physisch dasselbe ist, vervielfältigt es sich digital: unterschiedliche Vertriebskanäle, unterschiedliche Anforderungen der Schaufenster, unterschiedliche Sprachen und Formate.

Infografik: Formel
1 SKU × 5–10 Kanäle × 5–20 Sprachen
= 25–200+ Versionen
Derselbe Artikel wird dutzende Male in digitaler Form neu erstellt. Eine SKU wird in jeder Stufe der Kette neu geschrieben und neu kodiert, anstatt einmalig zur zuverlässigen Datenquelle zu werden.
Anzahl der SKUs und Produktkarten
Akteurtyp Typischer Produktkatalog
Kleinunternehmen 100–1 000 SKU
Der mittelständische Einzelhändler 10 000–100 000 SKU
Große Einzelhändler 100 000–500 000 SKU
Marktplätze Hunderte Millionen SKUs
Die größten Plattformen haben andere Dimensionen: Marktführer verwalten 350–600 Mio. SKUs.

Wie viele Informationseinheiten existieren

Wenn man Sprachen, Formate und Kanäle (Website, Marktplätze, Werbung, Feeds) berücksichtigt, beläuft sich die Anzahl der einzigartigen Einheiten von Produktinformationen (SKU × Sprache × Format × Kanal) auf Hunderte Milliarden Datenfragmente.

Zur Orientierung: Offene Kataloge wie Icecat enthalten 25+ Mio. Datenblätter in 77 Sprachen – dies veranschaulicht das Ausmaß mehrsprachiger Versionen.

Infografik: Komplexitätsfaktoren
SKU Basis
Sprachen 5–20
Vertriebskanäle 5–10
Formate / Anforderungen viele
Fazit: 25–200+ Datenversionen pro Artikel (Größenordnung).
Bis zu 80 % der Produktdaten im E-Commerce werden immer noch über Excel und ähnliche Formate übertragen. Im Zeitalter von APIs, Clouds und KI stützt sich der Markt auf Praktiken der 90er Jahre: manuelles Kopieren, Fehler und Datenverluste bei jedem Schritt.
Abschnitt 2

Content-Flusskette

Wo Daten verloren gehen

Produktinformationen gelangen selten direkt vom Hersteller zum Käufer. Die typische Kette lautet: Hersteller → Distributor → Lieferant → Shop → CMS → Marketing.

In jeder Phase werden Daten transformiert, Formate ändern sich, Informationen gehen verloren oder werden manuell umgeschrieben. Wenn der Hersteller etwa 20 Attribute festgelegt hat, schaffen es oft nur 10–15 bis zum Frontend.

Infografik: Verluste entlang der Kette
Hersteller
100%
Distributor
80–90%
Lieferant
70–80%
CMS
50–70%
Marketing
40–60%
Fazit: Dasselbe Produkt wird von verschiedenen Akteuren in der Kette oft 3–5 Mal manuell neu geschrieben.
Was in den einzelnen Schritten passiert
Hersteller

Erstellt die Quelldaten: Attribute, Artikelnummern, Bilder. Oft nur in einer Sprachversion und nach internen Standards.

Distributor / Lieferant

Überträgt Daten in eigene Vorlagen, fügt Felder hinzu (Bestände/Codes), verliert Marketingdetails, ändert das Format.

Shop / CMS

Importiert in die eigene Struktur, fügt SEO und Kategorien hinzu. Bei manueller Arbeit entstehen Tippfehler, Auslassungen und Inkonsistenzen.

Kanäle / Marketing

Erfordern separate Feeds und Formatbeschränkungen. Jede Abweichung führt dazu, dass das Produkt nicht im Kanal erscheint oder Fehler auftreten.

Der Markt hat längst Geld und Logistik automatisiert, aber die Produktdaten nicht. Zahlungen und Lagerhaltung funktionieren wie eine Industrie, aber Produktinhalte sind noch Handwerk.
Infografik: Wo die Bedeutung „verloren geht“
Inkompatibilität der Formate hoch
Manuelle Korrekturen hoch
Verluste über Kanäle mittelmäßig
Qualitative Bewertung: Wo Fehler und Auslassungen am häufigsten auftreten.
Abschnitt 3

Kosten des Content-Prozesses

Manuelle Arbeit

Im Massen-E-Commerce dauert die Bearbeitung einer einzelnen Produktkarte ohne Automatisierung typischerweise 5–20 Minuten, wobei die direkten Selbstkosten im Bereich von $1–5 liegen. Es gibt zwar auch komplexe Kategorien, aber dieser Bereich ist typisch für den Datenstrom.

Szenario A
5 Min.
1 $ / Artikel
Szenario B
10 Min.
3 $ / Artikel
Szenario C
20 Min.
5 $ / Artikel
Infografik: Was 1.000 SKUs bedeuten
A: 5 мин
≈ 83 Stunde
≈ $1 000
B: 10 мин
≈ 167 Stunden
≈ $3 000
C: 20 мин
≈ 333 Stunde
≈ $5 000
Und das ist nur die Erstverarbeitung. Aktualisierungen wiederholen diese Kosten immer wieder.
Ein weiteres Ausmaß: Manuelle Abgleichung
Für kleine Unternehmen sind typischerweise 8–12 Stunden manuelle Arbeit pro Woche für Abgleich und Korrekturen erforderlich. Das entspricht direkten Zeitkosten von $10.000–$18.000 pro Jahr.
Die Gemeinkosten für die Produktveröffentlichung werden vergleichbar mit denen der Logistik. Wo die Produktlogistik optimiert ist, bleibt die Content-Logistik oft manuell und unkontrolliert.
Der Preis der Fehler

Schlechte Datenqualität führt zu messbaren Verlusten: 15–25% des Umsatzes gehen durch fehlerhaften Content verloren; bis zu 25% der Retouren sind auf Nichterfüllung der Erwartungen zurückzuführen.

Schlechte Suchergebnisse8–12%
Retouren / Abweichungen5–8%
Daten- und Verfügbarkeitsfehler5–7%
Balken – Visualisierung der Anteile innerhalb der Gesamtverluste (symbolisch).
Was Zeit frisst
Datensammlung
Dateien / E-Mails
Normalisierung
Formate / Einheiten
Qualität
Prüfungen / Korrekturen
Kanäle
Feeds / Regeln
Jeder Marktteilnehmer ist heute sein eigenes „Kraftwerk“ und sein eigenes „Stromnetz“. In ausgereiften Industrien gibt es spezialisierte Infrastrukturanbieter. Im E-Commerce-Content fehlt diese Schicht jedoch weitgehend – daher macht jeder alles selbst.
Abschnitt 4

Kleine Unternehmen und Großkonzerne

Ein Problem – unterschiedliche Möglichkeiten

Großunternehmen können Lieferanten Formate aufzwingen und in Infrastruktur investieren. Kleine und mittlere Unternehmen müssen sich hingegen oft an eingehende Daten anpassen und ihr Sortiment einschränken, weil sie den Content nicht verarbeiten können.

Großkonzerne
  • stellen Anforderungen an Lieferanten
  • investieren in PIM und Integrationen
  • unterhalten Teams für Datenqualität
  • verkraften Fehler durch Skalierung
Kleine / mittlere Unternehmen
  • arbeitet in Lieferantenformaten
  • hat kein Budget für Infrastruktur
  • reduziert das Sortiment aufgrund von Inhalten
  • veröffentlicht unvollständige Artikel 'as is'
Inhalte werden zur versteckten Wachstumsbarriere: Fehlende Ressourcen verhindern Katalogwachstum.
Infografik: Wo die Macht des Formats liegt
Große
fordern ein Format
Kleine
passen sich dem Eingehenden an
In der digitalen Wirtschaft wird der Umfang eines Unternehmens zunehmend durch den Umfang seiner Daten bestimmt. Wenn ein Katalog nicht schnell und qualitativ hochwertig veröffentlicht werden kann, wird das Wachstum nicht durch die Nachfrage, sondern durch die operativen Prozesse begrenzt.
Abschnitt 5

Lieferanten als systemische Engpässe

Der Lieferant – der Ausgangspunkt der Inhalte

Lieferanten und Hersteller sind die ursprüngliche Quelle von Produktinformationen: Spezifikationen, Artikelnummern, Bilder, Verpackung, Zertifikate und technische Beschreibungen. Doch die Existenz von Daten bedeutet nicht deren Marktreife: Daten sind selten von Grund auf so strukturiert, dass sie die gesamte Kette bis zum Frontend ohne Verluste durchlaufen können.

In der Logistik gibt es Standards und Rollen (Spediteur, Lager, Fulfillment). In den Daten fehlen oft sowohl Standards als auch ein „Netzwerkbetreiber“: Der Lieferant muss ohne die entsprechende Infrastruktur sowohl der Erzeuger als auch der Integrator der Daten sein.

Hauptursache

Vielfalt der Formate und Wahrheitsquellen

Für dasselbe Sortiment existieren beim Lieferanten oft mehrere parallele Quellen: Ein Teil der Daten liegt im ERP, ein Teil in Tabellen, ein Teil in PDFs, ein Teil in E-Mails und Abstimmungen. Für den Einzelhandel resultiert dies in ständigen „Nachbesserungen“, Validierungen und manuellen Korrekturen.

Infografik: Wo die Lieferantendaten gespeichert sind
Systeme
ERP / Lager / Preislisten

Codes, Bestände, Verpackungsinformationen, einige Attribute.

Dateien
Excel / CSV

Kundenspezifische Vorlagen, manuelle Korrekturen.

Dokumente
PDFs / Kataloge

Marketingtexte und technische Spezifikationen.

Kommunikation
E-Mails / Messenger

Klarstellungen, fehlende Bilder, Ausnahmen.

Nicht standardisierte Attribute

Lieferanten stimmen ihre Daten in der Regel nicht auf ein einheitliches Marktschemata ab. Sie liefern, was sie haben: ihre eigenen Feldnamen, unterschiedliche Maßeinheiten, verschiedene Detailgrade. Daher erfolgt die „Standardisierung“ faktisch auf Seiten des Einzelhändlers oder Marktplatzes.

Eine Bedeutung Wie in den Daten vorhanden Was der Einzelhandel tut
Farbe Color / Colour / Col / Farbe / Nuance Ordnet zu, normalisiert
Größe Größe / Abmessungen Standardisiert Einheiten und Formate
Material Material / Zusammensetzung Erstellt Wertetabellen
Redundanz: Tausende Unternehmen führen dieselbe Normalisierung parallel durch – und zahlen immer wieder dafür.

Ein Lieferant – bis zu 5–10 Formate

In der Praxis muss ein Lieferant, der mit vielen Partnern zusammenarbeitet, **bis zu 5–10 verschiedene Vorlagen** und Attributsysteme pflegen. Danach steigen die Wartungskosten schneller als der Nutzen – und der Lieferant senkt entweder die Qualität oder weicht auf Zwischenhändler aus und verliert die Kontrolle.

≈ bis zu 5
Funktioniert noch

Manueller Support und seltene Updates.

≈ 5–10
Überlastungszone

Das Risiko von Fehlern und Desynchronisation steigt.

≈ 10+
Skalierungsstopp

Zwischenhändler und Kontrollverlust treten auf.

Warum sich ein Lieferant nicht „an alle anpassen“ kann

Die Gründe liegen meist nicht in mangelnder Bereitschaft, sondern in der Prozessökonomie: Die Unterstützung zahlreicher Formate wird zu einem eigenen Produkt. Im Folgenden finden Sie typische Einschränkungen.

Daten sind auf verschiedene Quellen verteilt

ERP-Systeme, Preislisten, Dateien, Kataloge und Kommunikation sind selten in einer einzigen Struktur zusammengeführt – eine „Single Source of Truth“ fehlt.

Zu viele Ausnahmen pro Kategorie

Unterschiedliche Kategorien erfordern unterschiedliche Detailtiefe und Attribute; eine universelle „One-Size-Fits-All“-Vorlage existiert nicht.

Begrenzte IT-Ressourcen und Prioritäten

Für viele Lieferanten ist „Content“ ein nachrangiger Prozess im Vergleich zu Produktion und Vertrieb, weshalb er keine systematischen Investitionen erhält.

Wachsende Kundenzahl vervielfacht die Update-Kosten

Jedes Update wird zu einer Kette von E-Mails und Korrekturen über zahlreiche Vorlagen; Desynchronisation wird zur Norm.

Infografik: Datenverlust auf dem Weg

Von den „Rohdaten“ zum Schaufenster – durch Verluste und Kopien

Der Lieferant liefert „wie besehen“
Eigene Felder, Einheiten, Versionen, nicht immer vollständige Struktur.
Der Einzelhandel verarbeitet nach
Attributabgleich, Normalisierung, Qualitätskontrolle.
Kanäle fordern eigene Formate
Feeds und Einschränkungen erzeugen zusätzliche Datenversionen.
Fazit: Der Markt zahlt für dasselbe mehrfach
Bedeutung geht verloren, Arbeit wird dupliziert, Updates wiederholen den Zyklus erneut.

Fazit des Abschnitts

Lieferanteninhalte sind der „Rohstoff“ des E-Commerce. Der Markt behandelt sie wie ein fertiges Produkt, obwohl zwischen dem Rohstoff und der digitalen Auslage eine Transformationsschicht liegt: Glossare, Normalisierung, Lokalisierung, Qualitätskontrolle und Aktualisierungen.

Solange diese Schicht als Infrastruktur fehlt, baut jeder Marktteilnehmer sie selbst – und deshalb wird das Problem nicht lokal gelöst.

Der Lieferant ist nicht „schuld“ am Chaos. Er hat keinen Anreiz, zum Integrator des gesamten Marktes zu werden. Aber der Markt verlangt systemisch genau das von ihm.
Wer das Format kontrolliert
Große Ketten fordern einen Standard
Kleine Händler akzeptieren das Eingehende
Die Format-Asymmetrie verstärkt die Datenqualitätslücke zwischen den Segmenten.
In harten Metriken
Versionen pro SKU 25–200+
Kettenkopien 3–5
Datenbedingte Verluste 15–25%
Was der Markt fordert
  • neutrale Schicht der Datentransformation
  • einheitliche Attribute- und Einheiten-Wörterbücher
  • Automatisierung von Updates und Qualitätssicherung
Fazit

Was diese Zahlen aussagen

1) Content ist Logistik, aber ohne die Industrie

Im E-Commerce sind Geld und Logistik längst industrialisiert. Produktdaten werden jedoch immer noch manuell, fragmentiert und mit Verlusten in Dutzenden von Versionen und Formaten übertragen.

2) Das Problem ist systemisch – und lässt sich daher nicht „innerhalb eines Unternehmens“ lösen

Jeder Akteur ist gezwungen, seine eigene Datenschicht für Transformationen aufzubauen: Attributabgleich, Normalisierung, Qualitätskontrolle, Lokalisierung, Feeds. Dies skaliert jedoch nicht auf Marktebene – die Arbeit wird von Tausenden von Unternehmen parallel dupliziert.

3) Die Kluft zwischen Groß und Klein vergrößert sich

Große Player können Lieferanten ein Format aufzwingen und in Infrastruktur investieren. Kleinere Unternehmen müssen oft 'as is' veröffentlichen, ihr Sortiment reduzieren und an Effizienz verlieren, weil sie den Content-Fluss nicht verarbeiten können.

Warum NotPIM entstanden ist Wir betrachten dieses Problem als infrastrukturell: Der Markt benötigt eine neutrale Schicht, die Duplizierung reduziert, Datenverluste minimiert und die Content-Logistik automatisiert, ohne zu versuchen, 'den Markt nach eigenen Vorstellungen zu verbiegen'. Nicht 'ein weiteres Schaufenster', nicht 'ein weiteres Format', sondern eine Methode, Marktteilnehmer auf Datenebene zu verbinden.
Die Kernaussage
Der Markt braucht eine Dateninfrastruktur – genauso wie er eine Logistikinfrastruktur braucht.

Deshalb liefern Einzellösungen keinen Skaleneffekt, ein Ökosystem-Ansatz hingegen schon.

Transparenz

Alle Werte auf dieser Seite sind Schätzungen der Größenordnungen und typische Bandbreiten für den internationalen Markt. Sie können je nach Land und Kategorie variieren, aber die allgemeine Marktdynamik (Duplizierung, Verluste, manueller Aufwand) bleibt unverändert.

Die Daten und Einschätzungen auf dieser Seite sind auf dem Stand von Dezember 2025.