Marknaden i siffror • E-handel som datamarknad

E-handelsmarknaden

data- och innehållsmarknaden

Vi är vana vid att mäta e-handel i beställningar och intäkter. Men bakom varje order finns en infrastruktur: specifikationer, beskrivningar, bilder, format, översättningar och oändliga godkännandeprocesser. Den här sidan belyser marknadens omfattning i siffror och processer.

Nyckeltal
storleksordning
28 miljoner+
e-handelsbutiker i världen
14 miljoner
varav i USA
350–600 miljoner
SKU hos marknadsledare
15–25%
förluster på grund av datafel
En enda SKU omvandlas till tiotals dataversioner: försäljningskanaler, språk, format, plattformskrav.

Hur du läser den här sidan

Denna artikel är avsiktligt detaljerad. Vi kortar inte ner materialet till 'några få punkter', eftersom problemets omfattning endast framgår genom kombinationen av siffror, kedjor och operativa effekter.

Vi beskriver inte hur lösningar och tekniker fungerar. Det finns andra sidor för det. Här är grunderna: hur datamarknaden ser ut idag och varför den nuvarande modellen slutar vara skalbar.

Förhållningssätt
Siffror + processer

Inte en 'åsikt', utan observerbar marknadsmekanik.

Fokus
Innehållslogistik

Var tid spenderas och var data går förlorad.

Resultat
Förståelse för skalan

Varför detta är en systemuppgift, inte en lokal sådan.

Inom de närmaste åren kommer kostnaden för att publicera en produkt online att bli lika stor som, och sedan överstiga, kostnaden för dess fysiska leverans. Logistik har optimerats i årtionden, medan innehållslogistiken fortfarande är manuell och fragmenterad.
Avsnitt 1

Datamarknadens omfattning

Antal inblandade aktörer

Det finns cirka 28 miljoner e-handelsbutiker globalt. Av dessa finns cirka 14 miljoner i USA, och flera miljoner i Europa (till exempel Storbritannien ≈ 1,1 miljoner, Tyskland ≈ 0,7 miljoner, Frankrike ≈ 0,6 miljoner).

Utöver detaljhandeln är miljontals tillverkare och leverantörer involverade i e-handelskedjorna. Bara i Europa finns det cirka 2,3 miljoner tillverkningsföretag som potentiellt tillhandahåller produktdata.

Världen
≈ 28 miljoner
e-handelswebbplatser
USA
≈ 14 miljoner
cirka 50% av världen
Europa
miljoner
UK 1,1 / DE 0,7 / FR 0,6
Infografik: Butiker per region (ungefärligt)
skalan är ungefärlig
USA
≈ 14 miljoner
Europa
≈ 5–7 miljoner
Resten av världen
≈ 7–9 miljoner
*Europa och resten av världen är en grov uppskattning av fördelningen, eftersom olika källor aggregerar webbplatser på olika sätt.
Den avgörande skaleffekten
1 SKU → tiotals dataversioner

Även om varan är fysiskt densamma, mångfaldigas den digitalt: olika försäljningskanaler, olika krav från olika plattformar, olika språk och format.

Infografik: Formel
1 SKU × 5–10 kanaler × 5–20 språk
= 25–200+ versioner
Samma produkt i digital form skapas tiotals gånger. En enda SKU skrivs om och kodas om i varje steg i kedjan istället för att en gång bli den pålitliga datakällan.
Antal SKU:er och produktkort
Aktörstyp Typisk katalog
Småföretag 100–1 000 SKU
Medelstor återförsäljare 10 000–100 000 SKU
Stora återförsäljare 100 000–500 000 SKU
Marknadsplatser hundratals miljoner SKU
De största plattformarna har en annan skala: 350–600 miljoner SKU hos marknadsledarna.

Hur många informationsenheter som existerar

Om man tar hänsyn till språk, format och kanaler (webbplats, marknadsplatser, annonsering, flöden), uppgår antalet unika produktinformationsenheter (SKU × språk × format × kanal) till hundratals miljarder datapunkter.

Som referens: öppna kataloger som Icecat innehåller 25+ miljoner datablad på 77 språk – detta illustrerar omfattningen av flerspråkiga versioner.

Infografik: Komplexitetsmultiplikatorer
SKU bas
Språk 5–20
Försäljningskanaler 5–10
Format / Krav många
Slutsats: 25–200+ versioner av data per produkt (storleksordning).
Upp till 80% av produktinnehållet inom e-handel överförs fortfarande via Excel och liknande format. I en era av API:er, molntjänster och artificiell intelligens bygger marknaden på metoder från 90-talet: manuell kopiering, fel och dataförluster i varje steg.
Avsnitt 2

Innehållets flödeskedja

Var data går förlorad

Produktinformation går sällan direkt från tillverkare till köpare. En typisk kedja är: tillverkare → distributör → leverantör → butik → CMS → marknadsföring.

I varje steg transformeras data, format ändras, en del information kastas bort och en del skrivs om manuellt. Om tillverkaren angav cirka 20 attribut, är det ofta bara 10–15 som når fram till butikshyllan.

Infografik: Förluster längs kedjan
Tillverkare
100%
Distributör
80–90%
Leverantör
70–80%
CMS
50–70%
Marknadsföring
40–60%
Slutsats: Samma produkt skrivs ofta om manuellt 3–5 gånger av olika aktörer i kedjan.
Vad som händer i stegen
Tillverkare

Skapar källdata: attribut, artikelnummer, bilder. Ofta – en språkversion och interna standarder.

Distributör / Leverantör

Översätter data till sina egna mallar, lägger till fält (lager/koder), förlorar marknadsföringsdetaljer, ändrar format.

Butik / CMS

Importerar till sin struktur, lägger till SEO och kategorier. Manuellt arbete leder till stavfel, utelämnanden och inkonsekvenser.

Kanaler / Marknadsföring

Kräver separata flöden och formatbegränsningar. Varje avvikelse leder till att produkten inte når kanalen eller orsakar fel.

Marknaden har länge automatiserat betalningar och leveranser, men har ännu inte automatiserat data. Betalningar och lager fungerar som en industri, medan produktinnehåll fortfarande är ett hantverk.
Infografik: Var meningen 'går förlorad'
Inkompatibilitet i format hög
Manuell redigering hög
Förluster i kanaler Medel
Kvalitativ bedömning: Var uppstår fel och utelämnanden oftast.
Avsnitt 3

Kostnaden för innehåll som process

Manuellt arbete

In mass e-commerce, processing a single product card without automation usually takes 5–20 minutes, with a direct cost ranging from $1–$5. There are complex categories, but this range is typical for the main flow.

Scenario A
5 min
$1 / produktkort
Scenario B
10 min
$3 / produktkort
Scenario C
20 min
$5 / produktkort
Infografik: Vad 1 000 SKU innebär
A: 5 мин
≈ 83 timme
≈ $1 000
B: 10 мин
≈ 167 timmar
≈ $3 000
C: 20 мин
≈ 333 timme
≈ $5 000
Och detta är bara den initiala bearbetningen. Uppdateringar upprepar dessa kostnader om och om igen.
En annan skala: manuell avstämning
För småföretag är 8–12 timmar manuellt arbete per vecka för avstämning och korrigeringar typiskt. Detta motsvarar direkta tidsrelaterade kostnader på $10 000–18 000 per år.
Omkostnaderna för produktpublicering börjar närma sig logistikkostnaderna. Där produktlogistiken är optimerad, förblir innehållslogistiken ofta manuell och okontrollerad.
Kostnaden för fel

Dålig datakvalitet leder till mätbara förluster: 15–25% av intäkterna går förlorade på grund av innehåll; upp till 25% av returerna beror på att förväntningarna inte matchar.

Dålig sökfunktionalitet8–12%
Returer / avvikelser5–8%
Fel i data och lagersaldo5–7%
Staplar – visualisering av andelar inom totala förluster (ungefärligt).
Vad som "äter" tid
Datainsamling
filer / e-post
Normalisering
format / enheter
Kvalitet
kontroller / korrigeringar
Kanaler
flöden / regler
Varje marknadsaktör är idag både sitt eget "kraftverk" och sitt eget "elbolag". I mogna branscher finns det separata leverantörer av infrastruktur. Inom e-handelsinnehåll saknas ett sådant lager nästan helt – därför gör alla allt själva.
Avsnitt 4

Småföretag och stora aktörer

Ett problem – olika förutsättningar

Stora företag kan diktera formatkrav för leverantörer och investera i infrastruktur. Små och medelstora företag tvingas oftare anpassa sig till inkommande data och begränsa sitt sortiment på grund av oförmåga att hantera innehållet.

Stora aktörer
  • dikterar krav för leverantörer
  • investerar i PIM och integrationer
  • har dedikerade team för datakvalitet
  • tolerera fel tack vare skalbarhet
Små / medelstora företag
  • hanterar leverantörsformat
  • saknar budget för infrastruktur
  • minskar sortimentet på grund av innehåll
  • publicerar ofullständiga produktkort "as is"
Innehållet blir en dold tillväxtbarriär: brist på resurser leder till att katalogen inte växer.
Infografik: Där formatet har makten
Stora
kräver format
Små
anpassar sig efter inkommande
I den digitala ekonomin bestäms företags skal allt oftare av datans omfattning. Om katalogen inte snabbt och kvalitativt kan publiceras begränsas tillväxten inte av efterfrågan, utan av operationella processer.
Avsnitt 5

Leverantörer som systemets flaskhals

Leverantören – utgångspunkten för innehållet

Leverantörer och tillverkare är den ursprungliga källan till produktinformation: specifikationer, artikelnummer, bilder, förpackningsdetaljer, certifikat och tekniska beskrivningar. Men att data finns betyder inte att den är redo för marknaden: data är sällan initialt strukturerad för att utan förluster kunna passera hela kedjan fram till webbutiken.

Inom logistik finns standarder och roller (transportör, lager, fulfillment). I data saknas ofta både standarder och en «nätverksoperatör»: leverantören tvingas agera både dataskapare och integrator – utan adekvat infrastruktur.

Huvudorsaken

Variation i format och sanningens källor

För samma sortiment har leverantören ofta flera parallella källor: en del data finns i ERP, en del i kalkylblad, en del i PDF-filer, och en del i e-post och överenskommelser. För detaljhandeln leder detta till ständiga «eftersläpningar», validering och manuella korrigeringar.

Infografik: Var leverantörsdata bor
System
ERP / Lager / Prislistor

Koder, lagerstatus, förpackningsinformation, delar av attribut.

Filer
Excel / CSV

Mallar anpassade för kunder, manuella justeringar.

Dokument
PDF / Kataloger

Marknadsföringstexter och specifikationer.

Kommunikation
E-post / Meddelanden

Förtydliganden, saknade bilder, undantag.

Icke-standardiserade attribut

Leverantörer brukar inte anpassa data efter en gemensam marknadsordlista. De levererar det de har: sina egna fältnamn, olika måttenheter och varierande detaljnivåer. Därför sker 'standardisering' i praktiken hos återförsäljaren eller marknadsplatsen.

En enda innebörd Hur det förekommer i data Vad detaljhandeln gör
Färg Color / Colour / Col / Färg / Nyans Matchar, normaliserar
Storlek Storlek / Dimensioner Standardiserar enheter och format
Material Material / Sammansättning Skapar värdeordlistor
Repetition: Tusentals företag utför samma normalisering parallellt – och betalar för det om och om igen.

En leverantör – upp till 5–10 format

I praktiken tvingas en leverantör som arbetar med ett stort antal partners underhålla **upp till 5–10 olika mallar** och attributsystem. Därefter börjar supportkostnaden växa snabbare än vinsten – och leverantören sänker antingen kvaliteten eller vänder sig till mellanhänder, vilket leder till förlorad kontroll.

≈ upp till 5
Fungerar fortfarande

Manuell support och sällsynta uppdateringar.

≈ 5–10
Överbelastningszon

Risken för fel och osynkronisering ökar.

≈ 10+
Skalningskollaps

Mellanhänder och förlorad kontroll uppstår.

Varför leverantören inte kan ”anpassa sig för alla”

Orsakerna ligger sällan i en 'ovillighet', utan i processens ekonomi: att underhålla stöd för många format blir en egen produkt. Nedan följer typiska begränsningar.

Data är utspridd över olika källor

ERP-system, prislistor, filer, kataloger och kommunikation är sällan samlade i en enhetlig struktur – en ”sanningskälla” saknas.

För många undantag per kategori

Olika kategorier kräver olika djup och olika attribut; en universell mall för ”allt” existerar inte.

Begränsade IT-resurser och prioriteringar

För många leverantörer är ”innehåll” en sidoaktivitet i förhållande till produktion och försäljning, och får därför inga systematiska investeringar.

Ökat kundantal multiplicerar kostnaden för uppdateringar

Varje uppdatering blir en kedja av utskick och ändringar över många mallar; osynkronisering blir normen.

Infografik: Dataförsämring på vägen

Från ”rådata” till skyltfönster – genom förluster och kopiering

Leverantören levererar 'i befintligt skick'
Egna fält, enheter, versioner, inte alltid komplett struktur.
Återförsäljaren bearbetar om
Attributmatchning, normalisering, kvalitetssäkring.
Kanaler kräver sina egna format
Flöden och restriktioner skapar ytterligare dataversioner.
Slutsats: marknaden betalar för samma sak flera gånger
Meningen går förlorad, arbetet dubbleras, uppdateringar upprepar cykeln på nytt.

Slutsats för avsnittet

Leverantörsinnehåll är e-handelns ”råmaterial”. Marknaden behandlar det som en färdig produkt, trots att det finns ett transformationslager mellan råmaterialet och skyltfönstret: ordböcker, normalisering, lokalisering, kvalitetskontroll och uppdateringar.

Så länge detta lager saknas som infrastruktur bygger varje marknadsaktör det själv – och det är därför problemet inte löses lokalt.

Leverantören är inte 'skyldig' till kaoset. De har inget incitament att bli integrator för hela marknaden. Men marknaden kräver systematiskt just detta av dem.
Vem kontrollerar formatet
Stora kedjor kräver standard
Små butiker accepterar inkommande
Formatasymmetrin förstärker klyftan i datakvalitet mellan segmenten.
I torra siffror
Versioner per SKU 25–200+
Kopieringar i kedjan 3–5
Förluster på grund av datafel 15–25%
Vad marknaden kräver
  • ett neutralt lager för datatransformation
  • gemensamma attributordlistor och enheter
  • automatisering av uppdateringar och kvalitetssäkring
Slutsats

Vad dessa siffror visar

1) Innehåll är logistik, men utan branschfokus

Inom e-handeln har pengar och leveranser länge industrialiserats. Men produktdata flyttas fortfarande manuellt, fragmenterat och med förluster – i dussintals versioner och format.

2) Problemet är systemiskt – och kan därför inte lösas 'inom ett enskilt företag'

Varje aktör tvingas bygga sitt eget lager för datatransformation: attributmatchning, normalisering, kvalitetskontroll, lokalisering, flöden. Men detta skalar inte på marknadsnivå – arbetet dupliceras hos tusentals företag parallellt.

3) Klyftan mellan stora och små företag ökar

Stora aktörer kan påtvinga leverantörer format och investera i infrastruktur. Mindre aktörer tvingas oftare publicera "as is", minska sortimentet och förlora effektivitet på grund av oförmåga att hantera innehållsflödet.

Varför NotPIM skapades Vi ser detta problem som ett infrastrukturproblem: marknaden behöver ett neutralt lager som minskar dubbelarbete, sänker dataförluster och automatiserar innehållslogistiken utan att försöka "tvinga marknaden till sig". Inte "ännu en skyltfönster", inte "ännu ett format", utan ett sätt att koppla samman marknadsaktörer på datanivå.
Kärnbudskapet
Marknaden behöver en datainfrastruktur, precis som den behöver en logistikinfrastruktur.

Därför ger 'ensamstående' lösningar ingen skalbarhet, medan ett ekosystemperspektiv gör det.

Transparens

Alla värden på sidan är uppskattningar av storleksordningar och typiska intervall baserade på den internationella marknaden. De kan variera mellan länder och kategorier, men marknadens övergripande mekanismer (duplicering, förluster, manuellt arbete) förblir desamma.

Data och bedömningar på denna sida är aktuella per december 2025.