De e-commerce markt
—
de data- en contentmarkt
We are used to measuring e-commerce in orders and revenue. But behind every order lies an infrastructure: specifications, descriptions, images, formats, translations, and endless approvals. This page captures the scale of the market in figures and processes.
Hoe deze pagina te lezen
Dit artikel is opzettelijk gedetailleerd. We reduceren de materie niet tot 'enkele punten', omdat de omvang van het probleem alleen duidelijk wordt door de combinatie van cijfers, ketens en operationele effecten.
We beschrijven hier niet hoe oplossingen en technologieën werken. Daarvoor zijn andere pagina's. Hier vindt u de fundamenten: hoe de datamarkt er vandaag uitziet en waarom deze in zijn huidige vorm niet langer schaalbaar is.
Geen 'mening', maar de observeerbare marktdynamiek.
Waar tijd wordt verspild en data verloren gaat.
Waarom dit een systeemopgave is, en geen lokale kwestie.
Omvang van de datamarkt
Hoeveel deelnemers zijn betrokken
Er zijn wereldwijd ongeveer 28 miljoen webwinkels actief. Ongeveer 14 miljoen daarvan bevinden zich in de VS, en enkele miljoenen in Europa (bijvoorbeeld het VK ≈ 1,1 miljoen, Duitsland ≈ 0,7 miljoen, Frankrijk ≈ 0,6 miljoen).
Naast de detailhandel zijn miljoenen fabrikanten en leveranciers betrokken bij e-commerceketens. Alleen al in Europa zijn er ongeveer 2,3 miljoen productiebedrijven die potentieel productgegevens aanleveren.
Zelfs als het product fysiek hetzelfde is, vermenigvuldigt het zich digitaal: verschillende verkoopkanalen, verschillende vereisten voor etalages, verschillende talen en formaten.
| Type speler | Typische catalogus |
|---|---|
| Kleine bedrijven | 100–1 000 SKU |
| Middelgrote retailer | 10 000–100 000 SKU |
| Grote retailers | 100 000–500 000 SKU |
| Marketplaces | honderden miljoenen SKU's |
Hoeveel informatie-eenheden er bestaan
Als we rekening houden met talen, formaten en kanalen (website, marktplaatsen, advertenties, feeds), dan loopt het aantal unieke eenheden productinformatie (SKU × taal × formaat × kanaal) op tot honderden miljarden datapunten.
Ter oriëntatie: openbare catalogi zoals Icecat bevatten 25+ miljoen datasheets in 77 talen — dit illustreert de schaal van meertalige versies.
De contentstroom
Waar data verloren gaat
Productinformatie gaat zelden rechtstreeks van de fabrikant naar de koper. De typische keten is: fabrikant → distributeur → leverancier → winkel → CMS → marketing.
In elke fase worden gegevens getransformeerd, formaten gewijzigd, informatie weggelaten en een deel handmatig herschreven. Als een fabrikant ongeveer 20 kenmerken heeft opgegeven, bereiken vaak maar 10 tot 15 de etalage.
Creëert de brondata: kenmerken, artikelnummers, afbeeldingen. Vaak in één taalversie en volgens interne standaarden.
Vertaalt gegevens naar eigen sjablonen, voegt velden toe (voorraad/codes), verliest marketingdetails, wijzigt het formaat.
Importeert in eigen structuur, voegt SEO en categorieën toe. Handmatig werk leidt tot typefouten, weglatingen en inconsistenties.
Vereisen afzonderlijke feeds en formaatbeperkingen. Elke discrepantie leidt tot het niet publiceren van het product op het kanaal of tot fouten.
Kosten van content als proces
Handmatig werk
In grootschalige e-commerce duurt het verwerken van één productkaart zonder automatisering doorgaans 5 tot 20 minuten, met directe kosten variërend van $1 tot $5. Hoewel er complexere categorieën zijn, is dit het typische bereik voor een productstroom.
Slechte datakwaliteit leidt tot meetbare verliezen: 15-25% van de omzet gaat verloren door content; tot 25% van de retouren is gerelateerd aan het niet voldoen aan de verwachtingen.
Kleine bedrijven en grote spelers
Eén probleem — verschillende mogelijkheden
Grote bedrijven kunnen formaten opleggen aan leveranciers en investeren in infrastructuur. MKB moet zich vaker aanpassen aan inkomende data en het assortiment beperken omdat ze de content niet kunnen verwerken.
- leggen eisen op aan leveranciers
- investeren in PIM en integraties
- hebben teams voor datakwaliteit
- vangen fouten op door schaalgrootte
- werkt met leveranciersformaten
- heeft geen budget voor infrastructuur
- beperkt assortiment vanwege content
- publiceert onvolledige kaarten 'as is'
Leveranciers als systemische bottleneck
Leverancier – het startpunt van de content
Leveranciers en fabrikanten zijn de oorspronkelijke bron van productinformatie: specificaties, artikelnummers, afbeeldingen, verpakking, certificaten en technische beschrijvingen. Maar het bestaan van gegevens betekent niet dat ze klaar zijn voor marktgebruik: gegevens zijn zelden vanaf het begin zo gestructureerd dat ze de hele keten tot aan de etalage zonder verliezen kunnen doorlopen.
In de logistiek zijn er standaarden en rollen (vervoerder, magazijn, fulfillment). In de gegevens ontbreken vaak zowel standaarden als een 'netwerkoperator': de leverancier is gedwongen om zowel de producent als de integrator van de gegevens te zijn — zonder de juiste infrastructuur.
Diversiteit aan formaten en waarheidspunten
Voor hetzelfde assortiment heeft de leverancier vaak meerdere parallelle bronnen: een deel van de gegevens zit in het ERP, een deel in spreadsheets, een deel in PDF's, en een deel in e-mails en goedkeuringen. Voor de detailhandel mondt dit uit in constante 'aanvullingen', validatie en handmatige correcties.
Codes, voorraden, verpakking, een deel van de attributen.
Klantspecifieke sjablonen, handmatige aanpassingen.
Marketingbeschrijvingen en specificaties.
Verduidelijkingen, ontbrekende foto's, uitzonderingen.
Niet-gestandaardiseerde attributen
Leveranciers stemmen hun gegevens doorgaans niet af op een uniforme marktstandaard voor kenmerken. Ze leveren wat ze hebben: hun eigen veldnamen, verschillende meeteenheden en verschillende detailniveaus. Daarom wordt de 'standaardisatie' feitelijk uitgevoerd aan de kant van de retailer of de marktplaats.
| Eén betekenis | Zoals het in de data voorkomt | Wat de retailer doet |
|---|---|---|
| Kleur | Color / Colour / Col / Kleur / Tint | Matcht, normaliseert |
| Maat | Afmetingen / Maatvoering | Normaliseert eenheden en formaten |
| Materiaal | Materiaal / Samenstelling | Creëert waardereferentietabellen |
Eén leverancier — tot 5-10 formaten
In de praktijk moet een leverancier die met veel partners werkt, **tot 5-10 verschillende sjablonen** en attribuutsystemen onderhouden. Vanaf dat punt stijgen de onderhoudskosten sneller dan de voordelen – en de leverancier verlaagt ofwel de kwaliteit, of schakelt tussenpersonen in, waardoor hij de controle verliest.
Handmatige ondersteuning en zeldzame updates.
Het risico op fouten en desynchronisatie neemt toe.
Tussenpersonen en verlies van controle ontstaan.
Waarom een leverancier zich niet 'voor iedereen kan aanpassen'
De redenen liggen meestal niet in 'onwil', maar in de economie van het proces: het ondersteunen van meerdere formaten wordt een op zichzelf staand product. Hieronder vindt u de typische beperkingen.
Gegevens verspreid over verschillende bronnen ▾
ERP, prijslijsten, bestanden, catalogi en communicatie zijn zelden samengebracht in één structuur — de 'single source of truth' ontbreekt.
Te veel uitzonderingen per categorie ▾
Verschillende categorieën vereisen verschillende diepgang en attributen; een universeel sjabloon 'voor alles' bestaat niet.
Beperkte IT-middelen en prioriteiten ▾
Voor veel leveranciers is 'content' een nevenproces ten opzichte van productie en verkoop, waardoor het geen systematische investeringen ontvangt.
Groeiend klantenbestand vermenigvuldigt de kosten van updates ▾
Elke update mondt uit in een keten van e-mails en correcties via talloze sjablonen; desynchronisatie wordt de norm.
Van 'ruwe data' naar de etalage — via verlies en duplicatie
Conclusie van dit gedeelte
Leverancierscontent is de 'grondstof' van e-commerce. De markt behandelt het als een eindproduct, terwijl er tussen de grondstof en de etalage een transformatielaag ligt: woordenboeken, normalisatie, lokalisatie, kwaliteitscontrole en updates.
Zolang deze laag als infrastructuur ontbreekt, bouwt elke marktdeelnemer deze zelf – en daarom wordt het probleem niet lokaal opgelost.
- neutrale datatransformatielaag
- uniforme attributen- en eenhedenwoordenboeken
- automatisering van updates en kwaliteitscontrole
Wat deze cijfers aantonen
1) Content is logistiek, maar dan zonder de industrie
In e-commerce zijn geld en levering al lang geïndustrialiseerd. Maar productgegevens worden nog steeds handmatig, gefragmenteerd en met verlies verplaatst — in tientallen versies en formaten.
2) Het probleem is systemisch – en kan daarom niet 'binnen één bedrijf' worden opgelost
Elke speler is gedwongen zijn eigen datatransformatielaag op te bouwen: attribuutmatching, normalisatie, kwaliteitscontrole, lokalisatie, feeds. Maar dit schaalt niet op marktniveau — het werk wordt parallel gedupliceerd door duizenden bedrijven.
3) De kloof tussen grote en kleine spelers wordt groter
Grote spelers kunnen leveranciers een formaat opleggen en investeren in infrastructuur. Kleinere spelers moeten vaker 'as is' publiceren, hun assortiment beperken en efficiëntie verliezen omdat ze de contentstroom niet kunnen verwerken.
Daarom leveren 'op zichzelf staande' oplossingen geen schaalvoordelen op, maar een ecosysteem-aanpak wel.
Alle waarden op de pagina zijn schattingen van de orde van grootte en typische bereiken voor de internationale markt. Ze kunnen per land en categorie verschillen, maar de algemene marktdynamiek (duplicatie, verlies, handmatig werk) blijft onveranderd.