Trh v číslech • E-commerce jako datový trh

E-commerce trh
—
trh dat a obsahu

E-commerce obvykle měříme v objednávkách a tržbách. Ale za každou objednávkou stojí infrastruktura: atributy, popisy, obrázky, formáty, překlady a nekonečné schvalování. Tato stránka zachycuje rozsah trhu v číslech a procesech.

Velikost trhu Datový řetězec Hodnota obsahu Výstupy

Klíčové ukazatele

řádové velikosti

28 milionů+

e-shopů na světě

14 milionů

z toho v USA

350–600 milionů

SKU u lídrů trhu

15–25%

ztrát kvůli datům

Jedno SKU se promění v desítky verzí dat: prodejní kanály, jazyky, formáty, požadavky platforem.

Navigace na stránce

1) Rozsah datového trhu 2) Kolik informačních jednotek 3) Kde se data ztrácejí 4) Cena obsahu 5) Malý byznys vs. velcí hráči 6) Dodavatelé jako úzké hrdlo (bottleneck) 7) Přeshraniční transformace 8) Systémový závěr

Data představují odhady řádů. Mohou se lišit napříč trhy, ale celkový obraz zůstává stabilní.

Jak číst tuto stránku

Tento článek je záměrně podrobný. Materiál nezkracujeme na „několik tezí“, protože rozsah problému se odhalí pouze kombinací čísel, řetězců a operačních efektů.

Neřešíme zde, jak jsou řešení a technologie postaveny. Od toho jsou jiné stránky. Zde jsou základy: jak je datový trh dnes uspořádán a proč v současné podobě přestává být škálovatelný.

Přístup

Čísla + procesy

Ne „názor“, ale pozorovatelná mechanika trhu.

Zaměření

Obsahová logistika

Kde se ztrácí čas a kde se ztrácejí data.

Výsledek

Pochopení rozsahu

Proč jde o systémový úkol, nikoli lokální.

V nadcházejících letech se náklady na publikaci produktu online vyrovnají a následně převýší náklady na jeho fyzickou dopravu. Logistika se optimalizuje desetiletí, zatímco logistika obsahu zůstává stále manuální a roztříštěná.

Sekce 1

Rozsah datového trhu

čísla – řádové velikosti

Kolik účastníků je zapojeno

Na světě provozuje přibližně 28 milionů e-shopů. Z toho asi 14 milionů v USA a několik milionů v Evropě (např. Velká Británie ≈ 1,1 milionu, Německo ≈ 0,7 milionu, Francie ≈ 0,6 milionu).

Kromě maloobchodu jsou do e-commerce řetězců zapojeny miliony výrobců a dodavatelů. Jen v Evropě je to asi 2,3 milionu výrobních společností, které potenciálně dodávají produktová data.

Svět

≈ 28 milionů

e-commerce webů

USA

≈ 14 milionů

přibližně 50 % světa

Evropa

miliony

UK 1,1 / DE 0,7 / FR 0,6

Infografika: Obchody podle regionů (přibližně)

měřítko je orientační

USA

≈ 14 milionů

Evropa

≈ 5–7 milionů

Zbytek světa

≈ 7–9 milionů

*Evropa a zbytek světa – hrubý odhad distribuce, protože různé zdroje agregují weby odlišně.

Klíčový efekt rozsahu

1 SKU → desítky verzí dat

I když je produkt fyzicky stejný, v digitální podobě se množí: různé prodejní kanály, různé požadavky výloh, různé jazyky a formáty.

Infografika: vzorec

1 SKU × 5–10 kanálů × 5–20 jazyků

= 25–200+ verzí

Stejný produkt se v digitální podobě vytváří desítkykrát. Jedno SKU je přepisováno a překódováváno na každém kroku řetězce, místo aby se jednou stalo spolehlivým zdrojem dat.

Kolik SKU a karet produktů

Typ hráče	Typický katalog
Malý podnik	100–1 000 SKU
Střední prodejce	10 000–100 000 SKU
Velcí prodejci	100 000–500 000 SKU
Marketplace	stovky milionů SKU

U největších platforem jsou měřítka jiná: lídři trhu spravují 350–600 milionů SKU.

Kolik datových jednotek existuje

Pokud vezmeme v úvahu jazyky, formáty a kanály (web, tržiště, reklama, feedy), počet unikátních jednotek produktových informací (SKU × jazyk × formát × kanál) se počítá na stovky miliard datových fragmentů.

Pro orientaci: otevřené katalogy jako Icecat obsahují 25+ milionů datových listů v 77 jazycích – to ilustruje rozsah vícejazyčných verzí.

Infografika: multiplikátory složitosti

SKU základ

Jazyky 5–20

Prodejní kanály 5–10

Formáty / požadavky mnoho

Výsledek: 25–200+ verzí dat na jeden produkt (řádově).

Až 80 % produktového obsahu v e-commerce se stále přenáší přes Excel a podobné formáty. V éře API, cloudu a umělé inteligence se trh spoléhá na postupy z 90. let: ruční kopírování, chyby a ztráty dat na každém kroku.

Sekce 2

Cesta toku obsahu

Kde se data ztrácejí

Produktové informace zřídka putují přímo od výrobce k zákazníkovi. Typický řetězec je: výrobce → distributor → dodavatel → obchod → CMS → marketing.

V každé fázi se data transformují, mění se formáty, část informací se vyřadí a část se přepisuje ručně. Pokud výrobce zadal asi 20 atributů, na výlohu se jich často dostane jen 10–15.

Infografika: ztráty v řetězci

Výrobce

100%

Distributor

80–90%

Dodavatel

70–80%

CMS

50–70%

Marketing

40–60%

Výsledek: stejné zboží je různými účastníky řetězce často ručně přepisováno 3–5krát.

Co se děje ve fázích

Výrobce

Vytváří zdrojová data: atributy, SKU, obrázky. Často pouze jedna jazyková verze a interní standardy.

Distributor / dodavatel

Přenáší data do vlastních šablon, přidává pole (sklady/kódy), ztrácí marketingové detaily, mění formát.

E-shop / CMS

Importuje do své struktury, přidává SEO a kategorie. Při manuální práci vznikají překlepy, chybějící údaje a nekonzistence.

Kanály / marketing

Vyžadují samostatné feedy a omezení formátu. Jakákoli nesrovnalost vede k tomu, že se produkt v kanálu neobjeví, nebo k chybám.

Trh dávno automatizoval peníze a logistiku, ale stále neautomatizoval data. Platby a sklady fungují jako průmysl, ale produktový obsah je stále řemeslo.

Infografika: Kde se ztrácí smysl

Nekompatibilita formátů vysoko

Manuální úpravy vysoko

Ztráty na kanálech střední

Kvalitativní hodnocení: kde nejčastěji dochází k chybám a opomenutím.

Sekce 3

Cena obsahu jako procesu

Manuální práce

V hromadném e-commerce obvykle zpracování jedné produktové karty bez automatizace zabere 5–20 minut a přímé náklady se pohybují v rozmezí $1–5. Existují i složité kategorie, ale tento rozsah je pro běžný datový tok typický.

Scénář A

5 min

$1 / produktová karta

Scénář B

10 min

$3 / položka

Scénář C

20 min

$5 / položka

Infografika: co znamená 1 000 SKU

A: 5 мин

≈ 83 hodiny

≈ $1 000

B: 10 мин

≈ 167 hodin

≈ $3 000

C: 20 мин

≈ 333 hodiny

≈ $5 000

A to je pouze prvotní zpracování. Aktualizace tyto náklady opakují znovu a znovu.

Další rozměr: manuální kontrola

Pro malé podniky je typických 8–12 hodin manuální práce týdně na kontrolu a úpravy. To odpovídá přímým časovým nákladům ve výši $10 000–18 000 ročně.

Režijní náklady na publikaci produktu se stávají srovnatelné s náklady na logistiku. Tam, kde je optimalizována produktová logistika, často zůstává logistika obsahu manuální a nekontrolovaná.

Cena chyb

Špatná kvalita dat vede k měřitelným ztrátám: 15–25 % tržeb se ztrácí kvůli obsahu; až 25 % vracení zboží souvisí s nesplněním očekávání.

Špatné vyhledávání8–12%

Vrácení zboží / Nesoulad5–8%

Chyby v datech a skladovosti5–7%

Pruhy – vizualizace podílů v rámci celkových ztrát (orientačně).

Co „požírá“ čas

Sběr dat

soubory / e-maily

Normalizace

formáty / jednotky

Kvalita

kontroly / úpravy

Kanály

feedy / pravidla

Každý účastník trhu je dnes sám sobě „elektrárnou“ i „elektrickou sítí“. Ve vyspělých odvětvích existují samostatní poskytovatelé infrastruktury. V obsahu e-commerce taková vrstva téměř chybí – proto si každý dělá vše sám.

Sekce 4

Malé podniky a velcí hráči

Jeden problém – různé možnosti

Velké společnosti si mohou vynucovat formáty na dodavatele a investovat do infrastruktury. Malé a střední podniky se častěji musí přizpůsobovat příchozím datům a omezovat sortiment kvůli neschopnosti obsah zpracovat.

Velcí hráči

diktují požadavky dodavatelům
investují do PIM a integrací
udržují týmy pro správu kvality dat
zvládají chyby díky škále

Malé / střední podniky

pracuje ve formátech dodavatelů
nemá rozpočet na infrastrukturu
omezuje sortiment kvůli obsahu
zveřejňuje neúplné karty „tak, jak jsou“

Obsah se stává skrytou překážkou růstu: nedostatek zdrojů znamená stagnaci katalogu.

Infografika: Kde vládne formát

Velcí

vyžadují formát

Malí

přizpůsobují se příchozímu

V digitální ekonomice je rozsah podnikání stále častěji určován rozsahem dat. Pokud nelze katalog rychle a kvalitně publikovat, růst je omezen nikoli poptávkou, ale operacemi.

Sekce 5

Dodavatelé jako systémové úzké hrdlo

zdroj dat ≠ datová infrastruktura

Dodavatel – výchozí bod obsahu

Dodavatelé a výrobci jsou primárním zdrojem informací o produktech: specifikace, SKU, obrázky, balení, certifikáty a technické popisy. Samotná existence dat však neznamená, že jsou připravena pro trh: data jsou zřídka od počátku strukturována tak, aby bez ztrát prošla celým řetězcem až na e-shop.

V logistice existují standardy a role (přepravce, sklad, fulfillment). V datech často chybí standardy i „síťový operátor“: dodavatel je nucen být jak výrobcem dat, tak jejich integrátorem – a to bez odpovídající infrastruktury.

Klíčový důvod

Různorodost formátů a bodů pravdy

Excel / CSV XML Katalogy ve formátu PDF portály API

Pro stejný sortiment má dodavatel často několik paralelních zdrojů: část dat je v ERP, část v tabulkách, část v PDF, část v e-mailech a schváleních. Pro retail se to proměňuje v neustálé „doplňování“, validaci a ruční opravy.

Infografika: Kde se nacházejí data dodavatele

Systémy

ERP / sklad / ceník

Kódy, skladové zásoby, balení, část atributů.

Soubory

Excel / CSV

Šablony pro klienty, manuální úpravy.

Dokumenty

PDF / katalogy

Marketingové popisy a specifikace.

Komunikace

E-maily / zprávy

Upřesnění, chybějící fotografie, výjimky.

Nestandardizované atributy

Dodavatelé obvykle neshodují data s jednotným slovníkem tržních atributů. Poskytují to, co mají: vlastní názvy polí, různé jednotky měření, různé úrovně podrobnosti. Proto se „standardizace“ ve skutečnosti provádí na straně maloobchodníka nebo tržiště.

Jeden význam	Jak se vyskytuje v datech	Co dělá retail
Barva	Color / Colour / Col / Barva / odstín	Mapuje, normalizuje
Velikost	Velikost / Rozměry	Sjednocuje jednotky a formát
Materiál	Materiál / Složení	Vytváří číselníky hodnot

Opakování: stejnou normalizaci provádějí tisíce firem paralelně – a platí za to znovu a znovu.

Jeden dodavatel – až 5–10 formátů

V praxi je dodavatel, který spolupracuje s velkým počtem partnerů, nucen udržovat **až 5–10 různých šablon** a systémů atributů. Následně náklady na údržbu začnou růst rychleji než výhody – a dodavatel buď sníží kvalitu, nebo přejde k prostředníkům a ztratí kontrolu.

Odhad rozsahu

5–10

šablon/formátů

≈ do 5

Stále to funguje

Manuální podpora a občasné aktualizace.

≈ 5–10

Zóna přetížení

Roste riziko chyb a nesouladu dat.

≈ 10+

Selhání škálování

Objevují se zprostředkovatelé a ztráta kontroly.

Proč se dodavatel nemůže „přizpůsobit všem“

Důvody obvykle nespočívají v „neochotě“, ale v ekonomice procesu: podpora mnoha formátů se stává samostatným produktem. Níže jsou uvedena typická omezení.

Data jsou roztříštěna v různých zdrojích ▾

ERP systémy, ceníky, soubory, katalogy a komunikace jsou zřídka sjednoceny do jedné struktury – chybí „jediný zdroj pravdy“ (single source of truth).

Příliš mnoho výjimek napříč kategoriemi ▾

Různé kategorie vyžadují různou hloubku a odlišné atributy; univerzální šablona „pro všechno“ neexistuje.

Omezené IT zdroje a priority ▾

Pro mnoho dodavatelů je „obsah“ vedlejším procesem k výrobě a prodeji, a proto nedostává systematické investice.

Růst počtu odběratelů násobí náklady na aktualizace ▾

Každá aktualizace se mění v řetězec e-mailů a úprav napříč mnoha šablonami; nesoulad se stává normou.

Infografika: Degradace dat na cestě

Od „surových dat“ k výloze – přes ztráty a kopírování

Dodavatel dodává „tak, jak to je“

Vlastní pole, jednotky, verze, ne vždy kompletní struktura.

Maloobchod to přepracovává

Mapování atributů, normalizace, kontrola kvality.

Kanály vyžadují vlastní formáty

Feedy a omezení vytvářejí další verze dat.

Výsledek: trh platí za totéž opakovaně

Ztrácí se smysl, práce se duplikuje, aktualizace opakují cyklus znovu.

Závěr sekce

Obsah od dodavatelů je „surovinou“ e-commerce. Trh s ním zachází jako s hotovým produktem, ačkoli mezi surovinou a výkladní skříní leží vrstva transformace: slovníky, normalizace, lokalizace, kontrola kvality a aktualizace.

Dokud tato vrstva neexistuje jako infrastruktura, každý účastník trhu si ji buduje sám – a proto se problém neřeší lokálně.

Dodavatel za chaos „není vinen“. Nemá motivaci stát se integrátorem celého trhu. Trh od něj ale systémově vyžaduje právě toto.

Kdo kontroluje formát

Velké řetězce vyžadují standard

Malé obchody přijímají příchozí data

Asymetrie formátu prohlubuje rozdíl v kvalitě dat mezi segmenty.

V tvrdých metrikách

Verzí na SKU 25–200+

Kopírování v řetězci 3–5

Ztráty způsobené daty 15–25%

Co trh vyžaduje

neutrální vrstva pro transformaci dat
sjednocené slovníky atributů a jednotek
automatizace aktualizací a kontroly kvality

Závěr

Co tato čísla ukazují

1) Obsah je logistika, ale bez průmyslu

V e-commerce jsou peníze a doručení dávno industrializovány. Ale produktová data se stále přesouvají ručně, fragmentovaně a se ztrátami – v desítkách verzí a formátů.

2) Problém je systémový – a proto se neřeší „uvnitř jedné společnosti“

Každý hráč je nucen budovat vlastní vrstvu transformace dat: mapování atributů, normalizace, kontrola kvality, lokalizace, feedy. Ale to se na úrovni trhu nemůže škálovat – práce se duplikuje u tisíců společností souběžně.

3) Rozdíly mezi velkými a malými hráči se prohlubují

Velcí hráči mohou dodavatelům vnucovat formát a investovat do infrastruktury. Menší jsou častěji nuceni publikovat „tak, jak to je“, omezovat sortiment a ztrácet efektivitu kvůli neschopnosti zpracovat datový tok.

Proč vznikl NotPIM Tento problém vnímáme jako infrastrukturní: trh potřebuje neutrální vrstvu, která snižuje duplikaci, omezuje ztráty dat a automatizuje obsahovou logistiku bez snahy „ohýbat trh pro sebe“. Ne „další výklad“, ne „další formát“, ale způsob, jak propojit účastníky trhu na úrovni dat.

Klíčové sdělení

Trh potřebuje datovou infrastrukturu – stejně jako potřebuje logistickou infrastrukturu.

Proto řešení „jednotlivce“ nepřinášejí efekt škálování, ale přístup na úrovni ekosystému ano.

Transparentnost

Všechny hodnoty na stránce jsou odhady řádů a typických rozsahů pro mezinárodní trh. Mohou se lišit podle zemí a kategorií, ale celková mechanika trhu (duplikace, ztráty, manuální práce) zůstává stejná.

Data a odhady na této stránce jsou aktuální k prosinci 2025.

E-commerce trh— trh dat a obsahu