Trh v číslech • E-commerce jako datový trh

E-commerce trh

trh dat a obsahu

E-commerce obvykle měříme v objednávkách a tržbách. Ale za každou objednávkou stojí infrastruktura: atributy, popisy, obrázky, formáty, překlady a nekonečné schvalování. Tato stránka zachycuje rozsah trhu v číslech a procesech.

Klíčové ukazatele
řádové velikosti
28 milionů+
e-shopů na světě
14 milionů
z toho v USA
350–600 milionů
SKU u lídrů trhu
15–25%
ztrát kvůli datům
Jedno SKU se promění v desítky verzí dat: prodejní kanály, jazyky, formáty, požadavky platforem.

Jak číst tuto stránku

Tento článek je záměrně podrobný. Materiál nezkracujeme na „několik tezí“, protože rozsah problému se odhalí pouze kombinací čísel, řetězců a operačních efektů.

Neřešíme zde, jak jsou řešení a technologie postaveny. Od toho jsou jiné stránky. Zde jsou základy: jak je datový trh dnes uspořádán a proč v současné podobě přestává být škálovatelný.

Přístup
Čísla + procesy

Ne „názor“, ale pozorovatelná mechanika trhu.

Zaměření
Obsahová logistika

Kde se ztrácí čas a kde se ztrácejí data.

Výsledek
Pochopení rozsahu

Proč jde o systémový úkol, nikoli lokální.

V nadcházejících letech se náklady na publikaci produktu online vyrovnají a následně převýší náklady na jeho fyzickou dopravu. Logistika se optimalizuje desetiletí, zatímco logistika obsahu zůstává stále manuální a roztříštěná.
Sekce 1

Rozsah datového trhu

Kolik účastníků je zapojeno

Na světě provozuje přibližně 28 milionů e-shopů. Z toho asi 14 milionů v USA a několik milionů v Evropě (např. Velká Británie ≈ 1,1 milionu, Německo ≈ 0,7 milionu, Francie ≈ 0,6 milionu).

Kromě maloobchodu jsou do e-commerce řetězců zapojeny miliony výrobců a dodavatelů. Jen v Evropě je to asi 2,3 milionu výrobních společností, které potenciálně dodávají produktová data.

Svět
≈ 28 milionů
e-commerce webů
USA
≈ 14 milionů
přibližně 50 % světa
Evropa
miliony
UK 1,1 / DE 0,7 / FR 0,6
Infografika: Obchody podle regionů (přibližně)
měřítko je orientační
USA
≈ 14 milionů
Evropa
≈ 5–7 milionů
Zbytek světa
≈ 7–9 milionů
*Evropa a zbytek světa – hrubý odhad distribuce, protože různé zdroje agregují weby odlišně.
Klíčový efekt rozsahu
1 SKU → desítky verzí dat

I když je produkt fyzicky stejný, v digitální podobě se množí: různé prodejní kanály, různé požadavky výloh, různé jazyky a formáty.

Infografika: vzorec
1 SKU × 5–10 kanálů × 5–20 jazyků
= 25–200+ verzí
Stejný produkt se v digitální podobě vytváří desítkykrát. Jedno SKU je přepisováno a překódováváno na každém kroku řetězce, místo aby se jednou stalo spolehlivým zdrojem dat.
Kolik SKU a karet produktů
Typ hráče Typický katalog
Malý podnik 100–1 000 SKU
Střední prodejce 10 000–100 000 SKU
Velcí prodejci 100 000–500 000 SKU
Marketplace stovky milionů SKU
U největších platforem jsou měřítka jiná: lídři trhu spravují 350–600 milionů SKU.

Kolik datových jednotek existuje

Pokud vezmeme v úvahu jazyky, formáty a kanály (web, tržiště, reklama, feedy), počet unikátních jednotek produktových informací (SKU × jazyk × formát × kanál) se počítá na stovky miliard datových fragmentů.

Pro orientaci: otevřené katalogy jako Icecat obsahují 25+ milionů datových listů v 77 jazycích – to ilustruje rozsah vícejazyčných verzí.

Infografika: multiplikátory složitosti
SKU základ
Jazyky 5–20
Prodejní kanály 5–10
Formáty / požadavky mnoho
Výsledek: 25–200+ verzí dat na jeden produkt (řádově).
Až 80 % produktového obsahu v e-commerce se stále přenáší přes Excel a podobné formáty. V éře API, cloudu a umělé inteligence se trh spoléhá na postupy z 90. let: ruční kopírování, chyby a ztráty dat na každém kroku.
Sekce 2

Cesta toku obsahu

Kde se data ztrácejí

Produktové informace zřídka putují přímo od výrobce k zákazníkovi. Typický řetězec je: výrobce → distributor → dodavatel → obchod → CMS → marketing.

V každé fázi se data transformují, mění se formáty, část informací se vyřadí a část se přepisuje ručně. Pokud výrobce zadal asi 20 atributů, na výlohu se jich často dostane jen 10–15.

Infografika: ztráty v řetězci
Výrobce
100%
Distributor
80–90%
Dodavatel
70–80%
CMS
50–70%
Marketing
40–60%
Výsledek: stejné zboží je různými účastníky řetězce často ručně přepisováno 3–5krát.
Co se děje ve fázích
Výrobce

Vytváří zdrojová data: atributy, SKU, obrázky. Často pouze jedna jazyková verze a interní standardy.

Distributor / dodavatel

Přenáší data do vlastních šablon, přidává pole (sklady/kódy), ztrácí marketingové detaily, mění formát.

E-shop / CMS

Importuje do své struktury, přidává SEO a kategorie. Při manuální práci vznikají překlepy, chybějící údaje a nekonzistence.

Kanály / marketing

Vyžadují samostatné feedy a omezení formátu. Jakákoli nesrovnalost vede k tomu, že se produkt v kanálu neobjeví, nebo k chybám.

Trh dávno automatizoval peníze a logistiku, ale stále neautomatizoval data. Platby a sklady fungují jako průmysl, ale produktový obsah je stále řemeslo.
Infografika: Kde se ztrácí smysl
Nekompatibilita formátů vysoko
Manuální úpravy vysoko
Ztráty na kanálech střední
Kvalitativní hodnocení: kde nejčastěji dochází k chybám a opomenutím.
Sekce 3

Cena obsahu jako procesu

Manuální práce

V hromadném e-commerce obvykle zpracování jedné produktové karty bez automatizace zabere 5–20 minut a přímé náklady se pohybují v rozmezí $1–5. Existují i složité kategorie, ale tento rozsah je pro běžný datový tok typický.

Scénář A
5 min
$1 / produktová karta
Scénář B
10 min
$3 / položka
Scénář C
20 min
$5 / položka
Infografika: co znamená 1 000 SKU
A: 5 мин
≈ 83 hodiny
≈ $1 000
B: 10 мин
≈ 167 hodin
≈ $3 000
C: 20 мин
≈ 333 hodiny
≈ $5 000
A to je pouze prvotní zpracování. Aktualizace tyto náklady opakují znovu a znovu.
Další rozměr: manuální kontrola
Pro malé podniky je typických 8–12 hodin manuální práce týdně na kontrolu a úpravy. To odpovídá přímým časovým nákladům ve výši $10 000–18 000 ročně.
Režijní náklady na publikaci produktu se stávají srovnatelné s náklady na logistiku. Tam, kde je optimalizována produktová logistika, často zůstává logistika obsahu manuální a nekontrolovaná.
Cena chyb

Špatná kvalita dat vede k měřitelným ztrátám: 15–25 % tržeb se ztrácí kvůli obsahu; až 25 % vracení zboží souvisí s nesplněním očekávání.

Špatné vyhledávání8–12%
Vrácení zboží / Nesoulad5–8%
Chyby v datech a skladovosti5–7%
Pruhy – vizualizace podílů v rámci celkových ztrát (orientačně).
Co „požírá“ čas
Sběr dat
soubory / e-maily
Normalizace
formáty / jednotky
Kvalita
kontroly / úpravy
Kanály
feedy / pravidla
Každý účastník trhu je dnes sám sobě „elektrárnou“ i „elektrickou sítí“. Ve vyspělých odvětvích existují samostatní poskytovatelé infrastruktury. V obsahu e-commerce taková vrstva téměř chybí – proto si každý dělá vše sám.
Sekce 4

Malé podniky a velcí hráči

Jeden problém – různé možnosti

Velké společnosti si mohou vynucovat formáty na dodavatele a investovat do infrastruktury. Malé a střední podniky se častěji musí přizpůsobovat příchozím datům a omezovat sortiment kvůli neschopnosti obsah zpracovat.

Velcí hráči
  • diktují požadavky dodavatelům
  • investují do PIM a integrací
  • udržují týmy pro správu kvality dat
  • zvládají chyby díky škále
Malé / střední podniky
  • pracuje ve formátech dodavatelů
  • nemá rozpočet na infrastrukturu
  • omezuje sortiment kvůli obsahu
  • zveřejňuje neúplné karty „tak, jak jsou“
Obsah se stává skrytou překážkou růstu: nedostatek zdrojů znamená stagnaci katalogu.
Infografika: Kde vládne formát
Velcí
vyžadují formát
Malí
přizpůsobují se příchozímu
V digitální ekonomice je rozsah podnikání stále častěji určován rozsahem dat. Pokud nelze katalog rychle a kvalitně publikovat, růst je omezen nikoli poptávkou, ale operacemi.
Sekce 5

Dodavatelé jako systémové úzké hrdlo

Dodavatel – výchozí bod obsahu

Dodavatelé a výrobci jsou primárním zdrojem informací o produktech: specifikace, SKU, obrázky, balení, certifikáty a technické popisy. Samotná existence dat však neznamená, že jsou připravena pro trh: data jsou zřídka od počátku strukturována tak, aby bez ztrát prošla celým řetězcem až na e-shop.

V logistice existují standardy a role (přepravce, sklad, fulfillment). V datech často chybí standardy i „síťový operátor“: dodavatel je nucen být jak výrobcem dat, tak jejich integrátorem – a to bez odpovídající infrastruktury.

Klíčový důvod

Různorodost formátů a bodů pravdy

Pro stejný sortiment má dodavatel často několik paralelních zdrojů: část dat je v ERP, část v tabulkách, část v PDF, část v e-mailech a schváleních. Pro retail se to proměňuje v neustálé „doplňování“, validaci a ruční opravy.

Infografika: Kde se nacházejí data dodavatele
Systémy
ERP / sklad / ceník

Kódy, skladové zásoby, balení, část atributů.

Soubory
Excel / CSV

Šablony pro klienty, manuální úpravy.

Dokumenty
PDF / katalogy

Marketingové popisy a specifikace.

Komunikace
E-maily / zprávy

Upřesnění, chybějící fotografie, výjimky.

Nestandardizované atributy

Dodavatelé obvykle neshodují data s jednotným slovníkem tržních atributů. Poskytují to, co mají: vlastní názvy polí, různé jednotky měření, různé úrovně podrobnosti. Proto se „standardizace“ ve skutečnosti provádí na straně maloobchodníka nebo tržiště.

Jeden význam Jak se vyskytuje v datech Co dělá retail
Barva Color / Colour / Col / Barva / odstín Mapuje, normalizuje
Velikost Velikost / Rozměry Sjednocuje jednotky a formát
Materiál Materiál / Složení Vytváří číselníky hodnot
Opakování: stejnou normalizaci provádějí tisíce firem paralelně – a platí za to znovu a znovu.

Jeden dodavatel – až 5–10 formátů

V praxi je dodavatel, který spolupracuje s velkým počtem partnerů, nucen udržovat **až 5–10 různých šablon** a systémů atributů. Následně náklady na údržbu začnou růst rychleji než výhody – a dodavatel buď sníží kvalitu, nebo přejde k prostředníkům a ztratí kontrolu.

≈ do 5
Stále to funguje

Manuální podpora a občasné aktualizace.

≈ 5–10
Zóna přetížení

Roste riziko chyb a nesouladu dat.

≈ 10+
Selhání škálování

Objevují se zprostředkovatelé a ztráta kontroly.

Proč se dodavatel nemůže „přizpůsobit všem“

Důvody obvykle nespočívají v „neochotě“, ale v ekonomice procesu: podpora mnoha formátů se stává samostatným produktem. Níže jsou uvedena typická omezení.

Data jsou roztříštěna v různých zdrojích

ERP systémy, ceníky, soubory, katalogy a komunikace jsou zřídka sjednoceny do jedné struktury – chybí „jediný zdroj pravdy“ (single source of truth).

Příliš mnoho výjimek napříč kategoriemi

Různé kategorie vyžadují různou hloubku a odlišné atributy; univerzální šablona „pro všechno“ neexistuje.

Omezené IT zdroje a priority

Pro mnoho dodavatelů je „obsah“ vedlejším procesem k výrobě a prodeji, a proto nedostává systematické investice.

Růst počtu odběratelů násobí náklady na aktualizace

Každá aktualizace se mění v řetězec e-mailů a úprav napříč mnoha šablonami; nesoulad se stává normou.

Infografika: Degradace dat na cestě

Od „surových dat“ k výloze – přes ztráty a kopírování

Dodavatel dodává „tak, jak to je“
Vlastní pole, jednotky, verze, ne vždy kompletní struktura.
Maloobchod to přepracovává
Mapování atributů, normalizace, kontrola kvality.
Kanály vyžadují vlastní formáty
Feedy a omezení vytvářejí další verze dat.
Výsledek: trh platí za totéž opakovaně
Ztrácí se smysl, práce se duplikuje, aktualizace opakují cyklus znovu.

Závěr sekce

Obsah od dodavatelů je „surovinou“ e-commerce. Trh s ním zachází jako s hotovým produktem, ačkoli mezi surovinou a výkladní skříní leží vrstva transformace: slovníky, normalizace, lokalizace, kontrola kvality a aktualizace.

Dokud tato vrstva neexistuje jako infrastruktura, každý účastník trhu si ji buduje sám – a proto se problém neřeší lokálně.

Dodavatel za chaos „není vinen“. Nemá motivaci stát se integrátorem celého trhu. Trh od něj ale systémově vyžaduje právě toto.
Kdo kontroluje formát
Velké řetězce vyžadují standard
Malé obchody přijímají příchozí data
Asymetrie formátu prohlubuje rozdíl v kvalitě dat mezi segmenty.
V tvrdých metrikách
Verzí na SKU 25–200+
Kopírování v řetězci 3–5
Ztráty způsobené daty 15–25%
Co trh vyžaduje
  • neutrální vrstva pro transformaci dat
  • sjednocené slovníky atributů a jednotek
  • automatizace aktualizací a kontroly kvality
Závěr

Co tato čísla ukazují

1) Obsah je logistika, ale bez průmyslu

V e-commerce jsou peníze a doručení dávno industrializovány. Ale produktová data se stále přesouvají ručně, fragmentovaně a se ztrátami – v desítkách verzí a formátů.

2) Problém je systémový – a proto se neřeší „uvnitř jedné společnosti“

Každý hráč je nucen budovat vlastní vrstvu transformace dat: mapování atributů, normalizace, kontrola kvality, lokalizace, feedy. Ale to se na úrovni trhu nemůže škálovat – práce se duplikuje u tisíců společností souběžně.

3) Rozdíly mezi velkými a malými hráči se prohlubují

Velcí hráči mohou dodavatelům vnucovat formát a investovat do infrastruktury. Menší jsou častěji nuceni publikovat „tak, jak to je“, omezovat sortiment a ztrácet efektivitu kvůli neschopnosti zpracovat datový tok.

Proč vznikl NotPIM Tento problém vnímáme jako infrastrukturní: trh potřebuje neutrální vrstvu, která snižuje duplikaci, omezuje ztráty dat a automatizuje obsahovou logistiku bez snahy „ohýbat trh pro sebe“. Ne „další výklad“, ne „další formát“, ale způsob, jak propojit účastníky trhu na úrovni dat.
Klíčové sdělení
Trh potřebuje datovou infrastrukturu – stejně jako potřebuje logistickou infrastrukturu.

Proto řešení „jednotlivce“ nepřinášejí efekt škálování, ale přístup na úrovni ekosystému ano.

Transparentnost

Všechny hodnoty na stránce jsou odhady řádů a typických rozsahů pro mezinárodní trh. Mohou se lišit podle zemí a kategorií, ale celková mechanika trhu (duplikace, ztráty, manuální práce) zůstává stejná.

Data a odhady na této stránce jsou aktuální k prosinci 2025.