Markedet i tal • E-handel som datamarked

E-handelsmarkedet

data- og indholdsmarkedet

Vi er vant til at måle e-handel i ordrer og omsætning. Men bag hver ordre ligger en infrastruktur: specifikationer, beskrivelser, billeder, formater, oversættelser og uendelige godkendelsesprocesser. Denne side dokumenterer markedets omfang i tal og processer.

Nøgletal
størrelsesordener
28 mio.+
webshops i verden
14 mio.
heraf i USA
350–600 mio.
SKU'er hos markedsledere
15–25%
tab på grund af data
Én SKU bliver til snesevis af dataversioner: salgskanaler, sprog, formater, platformskrav.

Sådan læser du denne side

Denne artikel er bevidst detaljeret. Vi forkorter ikke materialet til 'et par pointer', da problemets omfang kun afsløres gennem en kombination af tal, kæder og operationelle effekter.

Vi beskriver ikke, hvordan løsninger og teknologier fungerer. Det er der andre sider til. Her er grundlaget: hvordan datamarkedet er struktureret i dag, og hvorfor det i sin nuværende form holder op med at skalere.

Tilgang
Tal + processer

Ikke en 'mening', men markedets observerbare mekanik.

Fokus
Content-logistik

Hvor tid spildes, og hvor data går tabt.

Resultat
Forståelse af skala

Hvorfor det er en systemisk opgave, ikke en lokal én.

I de kommende år vil omkostningerne ved at publicere et produkt online matche, og derefter overstige omkostningerne ved dets fysiske levering. Logistik er blevet optimeret i årtier, mens indholdslogistik stadig er manuel og fragmenteret.
Afsnit 1

Omfanget af datamarkedet

Hvor mange aktører er involveret

Der er omkring 28 mio. webshops i verden. Af disse er omkring 14 mio. i USA, og flere millioner i Europa (f.eks. Storbritannien ≈ 1,1 mio., Tyskland ≈ 0,7 mio., Frankrig ≈ 0,6 mio.).

Ud over detailhandlen er millioner af producenter og leverandører involveret i e-handelskæder. Alene i Europa er der omkring 2,3 mio. produktionsvirksomheder, der potentielt leverer produktdata.

Verden
≈ 28 mio.
e-handelswebsteder
USA
≈ 14 mio.
omkring 50% af verden
Europa
millioner
UK 1,1 / DE 0,7 / FR 0,6
Infografik: Butikker efter region (omtrentligt)
skala er vejledende
USA
≈ 14 mio.
Europa
≈ 5–7 mio.
Resten af verden
≈ 7–9 mio.
*Europa og resten af verden er et groft estimat af fordelingen, da forskellige kilder aggregerer hjemmesider forskelligt.
Den centrale skalafaktor
1 SKU → snesevis af dataversioner

Selv hvis varen er den samme fysisk, mangedobles den digitalt: forskellige salgskanaler, forskellige krav fra udstillingsvinduer, forskellige sprog og formater.

Infografik: Formel
1 SKU × 5–10 kanaler × 5–20 sprog
= 25–200+ versioner
Det samme produkt produceres i digital form adskillige gange. Hver SKU omskrives og omkodes ved hvert trin i kæden i stedet for at blive én pålidelig datakilde én gang for alle.
Antal SKU'er og produktkort
Spillertype Typisk katalog
Små virksomheder 100–1 000 SKU
Mellemstore detailhandlere 10 000–100 000 SKU
Store detailhandlere 100 000–500 000 SKU
Markedspladser hundreder af millioner SKU'er
De største platforme har andre dimensioner: 350–600 mio. SKU'er hos markedslederne.

Hvor mange informationsenheder findes der

Hvis man medregner sprog, formater og kanaler (website, markedspladser, annoncering, feeds), tælles antallet af unikke enheder af produktinformation (SKU × sprog × format × kanal) i hundreder af milliarder datastykker.

Til orientering: Åbne kataloger som Icecat indeholder 25+ mio. datablade på 77 sprog – det illustrerer omfanget af flersprogede versioner.

Infografik: Kompleksitetsfaktorer
SKU base
Sprog 5–20
Salgskanaler 5–10
Formater / Krav mange
Resultat: 25–200+ versioner af data pr. vare (størrelsesorden).
Op til 80% af produktindholdet i e-handel overføres stadig via Excel og lignende formater. I en æra med API'er, cloud-løsninger og kunstig intelligens baserer markedet sig på praksisser fra 90'erne: manuel kopiering, fejl og datatab ved hvert trin.
Afsnit 2

Indholdsflowet

Hvor data går tabt

Produktinformation går sjældent direkte fra producent til køber. Den typiske kæde er: producent → distributør → leverandør → butik → CMS → marketing.

På hvert trin transformeres data, formater ændres, noget information kasseres, og noget omskrives manuelt. Hvis producenten har angivet omkring 20 attributter, når kun 10-15 ofte frem til webshoppen.

Infografik: tab i forsyningskæden
Producent
100%
Distributør
80–90%
Leverandør
70–80%
CMS
50–70%
Marketing
40–60%
Resultat: Det samme produkt omskrives ofte manuelt 3-5 gange af forskellige aktører i kæden.
Hvad sker der i de enkelte faser
Producent

Opretter de oprindelige data: attributter, varenumre, billeder. Ofte kun én sprogversion og interne standarder.

Distributør / Leverandør

Oversætter data til egne skabeloner, tilføjer felter (lagerbeholdning/koder), mister marketingdetaljer, ændrer format.

Butik / CMS

Importerer til sin egen struktur, tilføjer SEO og kategorier. Manuelt arbejde introducerer slåfejl, udeladelser og uoverensstemmelser.

Kanaler / Marketing

Kræver separate feeds og formatbegrænsninger. Enhver uoverensstemmelse fører til, at produktet ikke når kanalen, eller til fejl.

Markedet har længe automatiseret penge og levering, men har endnu ikke automatiseret data. Betalinger og lager fungerer som en industri, mens produktindhold stadig er et håndværk.
Infografik: Hvor meningen 'går tabt'
Inkompatibilitet mellem formater højt
Manuel redigering højt
Tab på kanalerne gennemsnitligt
Kvalitativ vurdering: Hvor opstår fejl og mangler oftest.
Afsnit 3

Omkostninger ved indhold som proces

Manuelt arbejde

I masse-e-handel tager behandlingen af ét enkelt produktkort uden automatisering typisk 5-20 minutter, og de direkte omkostninger ligger i intervallet $1-$5. Der findes også komplekse kategorier, men dette interval er typisk for den daglige strøm.

Scenarie A
5 min.
$1 / varekort
Scenarie B
10 min
$3 / vare
Scenarie C
20 min
$5 / vare
Infografik: Hvad betyder 1.000 SKU'er
A: 5 мин
≈ 83 time
≈ $1 000
B: 10 мин
≈ 167 timer
≈ $3 000
C: 20 мин
≈ 333 time
≈ $5 000
Og det er kun den indledende behandling. Opdateringer gentager disse omkostninger igen og igen.
Endnu en skala: Manuel afstemning
For små virksomheder er det typisk 8-12 timer manuelt arbejde om ugen til afstemning og rettelser. Det svarer til $10.000–$18.000 i årlige direkte tidsomkostninger.
Omkostningerne ved produktudgivelse er ved at blive sammenlignelige med logistikomkostninger. Hvor produktlogistikken er optimeret, forbliver indholdslogistikken ofte manuel og ukontrolleret.
Prisen på fejl

Dårlig datakvalitet fører til målbare tab: **15-25%** af omsætningen går tabt på grund af indhold; op til **25%** af returneringer skyldes, at forventningerne ikke stemmer overens.

Dårlig søgning8–12%
Returneringer / uoverensstemmelser5–8%
Data- og lagerfejl5–7%
Striben er en visualisering af andele inden for de samlede tab (vejledende).
Hvad der 'sluger' tid
Dataindsamling
filer / e-mails
Normalisering
formater / enheder
Kvalitet
kontrol / rettelser
Kanaler
feeds / regler
Hver markedsdeltager er i dag både sit eget 'kraftværk' og sit eget 'elnet'. I modne industrier findes der dedikerede infrastrukturudbydere. Inden for e-handelsindhold mangler dette lag næsten fuldstændigt – derfor gør alle alting selv.
Afsnit 4

Små virksomheder og store spillere

Ét problem – forskellige muligheder

Store virksomheder kan diktere formater til leverandører og investere i infrastruktur. Små og mellemstore virksomheder er oftere tvunget til at tilpasse sig indgående data og begrænse sortimentet på grund af manglende evne til at behandle indholdet.

Store spillere
  • dikterer krav til leverandører
  • investerer i PIM og integrationer
  • har dedikerede teams til datakvalitet
  • kan absorbere fejl på grund af skala
Små / mellemstore virksomheder
  • fungerer i leverandørformater
  • har ikke budget til infrastruktur
  • reducerer sortimentet på grund af indhold
  • publicerer ufuldstændige kort 'som de er'
Indhold bliver en skjult vækstbarriere: mangel på ressourcer betyder, at kataloget ikke vokser.
Infografik: Hvor formatets magt ligger
Store
kræver format
Små
tilpasser sig det indgående
I den digitale økonomi bestemmes virksomhedens skala i stigende grad af datamængden. Hvis kataloget ikke kan publiceres hurtigt og i høj kvalitet, begrænses væksten ikke af efterspørgslen, men af driften.
Afsnit 5

Leverandører som et systemisk flaskehals

Leverandøren er udgangspunktet for indholdet

Leverandører og producenter er den oprindelige kilde til produktinformation: specifikationer, varenumre, billeder, emballage, certifikater og tekniske beskrivelser. Men tilstedeværelsen af data betyder ikke, at de er klar til markedet: data er sjældent oprindeligt struktureret til at kunne gennemløbe hele kæden til webshoppen uden tab.

I logistik er der standarder og roller (transportør, lager, fulfillment). I data mangler der ofte både standarder og en 'netværksoperatør': leverandøren tvinges til at være både dataskaber og integrator – uden den nødvendige infrastruktur.

Hovedårsagen

Mangfoldighed af formater og sandhedspunkter

For det samme sortiment har leverandøren ofte flere parallelle kilder: nogle data er i ERP, nogle i regneark, nogle i PDF'er, og andre i e-mails og godkendelser. For detailhandlen resulterer dette i konstante 'eftersamlinger', validering og manuelle rettelser.

Infografik: Hvor leverandørdata bor
Systemer
ERP / Lager / Prisliste

Koder, beholdning, emballage, dele af attributter.

Filer
Excel / CSV

Skabeloner til kunder, manuelle justeringer.

Dokumenter
PDF / Kataloger

Marketingbeskrivelser og specifikationer.

Kommunikation
E-mails / Beskeder

Afklaringer, manglende billeder, undtagelser.

Ikke-standardiserede attributter

Leverandører er sjældent enige om data i henhold til en fælles markedsordbog for attributter. De leverer, hvad de har: deres egne feltnavne, forskellige måleenheder og forskellige detaljeringsniveauer. Derfor udføres 'standardisering' i praksis på detailhandlerens eller markedspladsens side.

Én betydning Som det fremgår af data Hvad detailhandlen gør
Farve Color / Colour / Col / Farve / nuance Matcher, normaliserer
Størrelse Størrelse / Dimensioner / Mål Standardiserer enheder og format
Materiale Materiale / Sammensætning / Indhold Opretter opslagstabeller for værdier
Gentagelse: Tusindvis af virksomheder udfører den samme normalisering parallelt – og betaler for det igen og igen.

Én leverandør – op til 5-10 formater

I praksis er en leverandør, der arbejder med et stort antal partnere, tvunget til at vedligeholde **op til 5-10 forskellige skabeloner** og attributsystemer. Derefter begynder omkostningerne ved vedligeholdelse at stige hurtigere end fordelen – og leverandøren reducerer enten kvaliteten eller går til mellemmænd og mister kontrollen.

≈ op til 5
Fungerer stadig

Manuel support og sjældne opdateringer.

≈ 5–10
Overbelastningszone

Risikoen for fejl og usynkronisering stiger.

≈ 10+
Skalering bryder sammen

Mellemmænd opstår, og kontrollen mistes.

Hvorfor leverandøren ikke kan 'tilpasse sig alle'

Årsagerne ligger sjældent i 'manglende vilje', men snarere i processens økonomi: at understøtte mange formater bliver et selvstændigt produkt. Nedenfor er typiske begrænsninger.

Data er spredt på tværs af forskellige kilder

ERP-systemer, prislister, filer, kataloger og kommunikation er sjældent samlet i én struktur – en 'single source of truth' mangler.

For mange undtagelser pr. kategori

Forskellige kategorier kræver forskellig dybde og forskellige attributter; en universel skabelon 'til alt' eksisterer ikke.

Begrænsede IT-ressourcer og prioriteter

For mange leverandører er 'indhold' en sekundær proces i forhold til produktion og salg, og modtager derfor ikke systemiske investeringer.

Vækst i kundebase mangedobler omkostningerne ved opdateringer

Hver opdatering udvikler sig til en kæde af e-mails og rettelser på tværs af mange skabeloner; usynkronisering bliver normen.

Infografik: Datadegradering undervejs

Fra 'rådata' til salgsvinduet – gennem tab og kopiering

Leverandøren leverer 'som det er'
Egne felter, enheder, versioner, ikke altid fuld struktur.
Detailhandlen ombearbejder
Attributmapping, normalisering, kvalitetskontrol.
Kanaler kræver deres egne formater
Feeds og begrænsninger skaber yderligere dataversioner.
Resultat: Markedet betaler flere gange for det samme
Meningen går tabt, arbejdet duplikeres, opdateringer gentager cyklussen.

Konklusion for sektionen

Leverandørindhold er e-handelens "råmateriale". Markedet behandler det som et færdigt produkt, selvom der ligger et lag af transformation mellem råmaterialet og butiksfacaden: ordbøger, normalisering, lokalisering, kvalitetskontrol og opdateringer.

Så længe dette lag mangler som infrastruktur, bygger hver markedsaktør det selv – og derfor løses problemet ikke lokalt.

Leverandøren er ikke 'skyldig' i kaosset. De har intet incitament til at blive integrator for hele markedet. Men markedet kræver systemisk set netop dette af dem.
Hvem kontrollerer formatet
Store detailkæder kræver standard
Små butikker accepterer det indgående
Formatasymmetrien forstærker kløften i datakvalitet mellem segmenterne.
I tørre tal
Versioner pr. SKU 25–200+
Kopieringer i forsyningskæden 3–5
Datarelaterede tab 15–25%
Hvad markedet efterspørger
  • neutralt lag til datatransformation
  • fælles ordbøger for attributter og enheder
  • automatisering af opdateringer og kvalitetskontrol
Konklusion

Hvad disse tal viser

1) Indhold er logistik, men uden industrien

Inden for e-handel er penge og levering for længst industrialiseret. Men produktdata flyttes stadig manuelt, fragmenteret og med tab – i snesevis af versioner og formater.

2) Problemet er systemisk – og kan derfor ikke løses 'internt i én virksomhed'

Hver aktør er tvunget til at opbygge sit eget lag til datatransformation: attributsammenligning, normalisering, kvalitetskontrol, lokalisering, feeds. Men dette skalerer ikke på markedsniveau – arbejdet duplikeres parallelt hos tusindvis af virksomheder.

3) Kløften mellem store og små virksomheder øges

Store aktører kan påtvinge leverandører et format og investere i infrastruktur. Mindre aktører er oftere tvunget til at publicere 'som det er', reducere sortimentet og miste effektivitet på grund af manglende evne til at håndtere indholdsstrømmen.

Hvorfor NotPIM opstod Vi ser dette problem som et infrastrukturelt problem: Markedet har brug for et neutralt lag, der reducerer duplikering, mindsker datatab og automatiserer indholdslogistikken uden forsøg på at 'tvinge markedet til at passe til sig selv'. Ikke 'endnu en butiksfacade', ikke 'endnu et format', men en måde at forbinde markedsdeltagere på dataniveau.
Nøgleformulering
Markedet har brug for datainfrastruktur – ligesom det har brug for logistikinfrastruktur.

Derfor giver 'alene'-løsninger ikke skaleringseffekt, mens en økosystemtilgang gør det.

Gennemsigtighed

Alle værdier på siden er estimater af størrelsesordener og typiske intervaller baseret på det internationale marked. De kan variere efter lande og kategorier, men markedets generelle mekanik (duplikering, tab, manuelt arbejde) forbliver uændret.

Data og vurderinger på denne side er aktuelle pr. december 2025.