Trh v číslach • E-commerce ako trh s dátami

E-commerce trh

trh s dátami a obsahom

E-commerce zvykneme merať objednávkami a tržbami. Ale za každou objednávkou stojí infraštruktúra: špecifikácie, popisy, obrázky, formáty, preklady a nekonečné schvaľovania. Táto stránka zachytáva rozsah trhu v číslach a procesoch.

Kľúčové meradlá
rády
28 mil.+
e-shopov na svete
14 mil.
z toho v USA
350 – 600 mil.
SKU u lídrov trhu
15–25%
strát kvôli dátam
Jedno SKU sa mení na desiatky verzií dát: predajné kanály, jazyky, formáty, požiadavky platforiem.

Ako čítať túto stránku

Tento článok je zámerne podrobný. Materiál neskracujeme na „niekoľko téz“, pretože rozsah problému sa odhalí len kombináciou čísel, reťazcov a prevádzkových efektov.

Neopisujeme, ako sú nastavené riešenia a technológie. Na to sú určené iné stránky. Tu sú základy: ako je dnes štruktúrovaný trh s dátami a prečo v súčasnej podobe prestáva byť škálovateľný.

Prístup
Čísla + procesy

Nie „názor“, ale pozorovateľná mechanika trhu.

Zameranie
Obsahová logistika

Kde sa stráca čas a kde sa strácajú dáta.

Výsledok
Pochopenie rozsahu

Prečo ide o systémovú, a nie lokálnu úlohu.

V najbližších rokoch sa náklady na publikovanie produktu online vyrovnajú a následne prevýšia náklady na jeho fyzickú prepravu. Logistika sa optimalizuje desaťročia, zatiaľ čo logistika obsahu zostáva manuálna a roztrieštená.
Sekcia 1

Rozsah trhu s dátami

Koľko účastníkov je zapojených

Na svete funguje približne 28 miliónov e-shopov. Z toho je asi 14 miliónov v USA a v Európe niekoľko miliónov (napr. Veľká Británia ≈ 1,1 mil., Nemecko ≈ 0,7 mil., Francúzsko ≈ 0,6 mil.).

Okrem maloobchodu sú do e-commerce reťazcov zapojené milióny výrobcov a dodávateľov. Len v Európe je to približne 2,3 milióna výrobných spoločností, ktoré potenciálne dodávajú produktové dáta.

Svet
≈ 28 mil.
e-commerce stránok
USA
≈ 14 mil.
približne 50 % sveta
Európa
milióny
UK 1,1 / DE 0,7 / FR 0,6
Infografika: Obchody podľa regiónov (približne)
mierka je orientačná
USA
≈ 14 mil.
Európa
≈ 5 – 7 mil.
Zvyšok sveta
≈ 7 – 9 miliónov
*Európa a zvyšok sveta – hrubý odhad distribúcie, pretože rôzne zdroje agregujú weby odlišne.
Kľúčový efekt škálovania
1 SKU → desiatky verzií dát

Aj keď je produkt fyzicky ten istý, v digitálnej podobe sa množí: rôzne predajné kanály, rôzne požiadavky výkladov, rôzne jazyky a formáty.

Infografika: vzorec
1 SKU × 5–10 kanálov × 5–20 jazykov
= 25–200+ verzií
Rovnaký produkt sa v digitálnej podobe vytvára desiatky krát. Jedno SKU sa prepisuje a prekóduje na každom kroku reťazca namiesto toho, aby sa raz stalo spoľahlivým zdrojom dát.
Koľko SKU a kariet produktov
Typ hráča Typický katalóg
Malý podnik 100–1 000 SKU
Stredný maloobchodník 10 000–100 000 SKU
Veľkí maloobchodníci 100 000–500 000 SKU
Marketplace stovky miliónov SKU
Najväčšie platformy majú iné rozmery: lídri trhu operujú s **350–600 miliónmi SKU**.

Koľko informačných jednotiek existuje

Ak zohľadníme jazyky, formáty a kanály (web, marketplace, reklama, feedy), počet unikátnych jednotiek produktových informácií (SKU × jazyk × formát × kanál) sa počíta na **stovky miliárd** dátových fragmentov.

Pre orientáciu: otvorené katalógy ako Icecat obsahujú **25+ miliónov** dátových listov v **77 jazykoch** – to ilustruje rozsah viacjazyčných verzií.

Infografika: multiplikátory zložitosti
SKU základ
Jazyky 5–20
Predajné kanály 5–10
Formáty / požiadavky mnoho
Výsledok: 25–200+ verzií dát na jeden produkt (radovo).
Až 80 % produktového obsahu v e-commerce sa dodnes prenáša cez Excel a podobné formáty. V ére API, cloudov a umelej inteligencie sa trh spolieha na postupy z 90. rokov: manuálne kopírovanie, chyby a straty dát pri každom kroku.
Sekcia 2

Reťazec pohybu obsahu

Kde sa dáta strácajú

Produktové informácie zriedka idú priamo od výrobcu k zákazníkovi. Typický reťazec: výrobca → distribútor → dodávateľ → obchod → CMS → marketing.

V každej fáze sa dáta transformujú, menia sa formáty, časť informácií sa vyradí a časť sa prepíše ručne. Ak výrobca zadal približne 20 atribútov, k e-shopu sa často dostane len 10 – 15.

Infografika: straty v reťazci
Výrobca
100%
Distribútor
80–90%
Dodávateľ
70–80%
CMS
50–70%
Marketing
40–60%
Výsledok: ten istý produkt je často ručne prepísaný 3 – 5-krát rôznymi účastníkmi reťazca.
Čo sa deje vo fázach
Výrobca

Vytvára zdrojové dáta: atribúty, SKU, obrázky. Často ide o jednu jazykovú verziu a interné štandardy.

Distribútor / dodávateľ

Prekladá dáta do svojich šablón, pridáva polia (zásoby/kódy), stráca marketingové detaily, mení formát.

Obchod / CMS

Importuje do svojej štruktúry, pridáva SEO a kategórie. Pri manuálnej práci sa objavujú preklepy, chýbajúce údaje a nezhody.

Kanály / marketing

Vyžadujú samostatné feedy a obmedzenia formátu. Akákoľvek nezhoda vedie k tomu, že sa produkt nedostane do kanála, alebo k chybám.

Trh dávno zautomatizoval peniaze a doručenie, ale stále nezautomatizoval dáta. Platby a sklady fungujú ako priemysel, zatiaľ čo produktový obsah je stále remeslom.
Infografika: Kde sa „stráca“ význam
Nekompatibilita formátov vysoko
Manuálne úpravy vysoko
Strata na kanáloch stredne
Kvalitatívne hodnotenie: kde najčastejšie vznikajú chyby a chýbajúce údaje.
Sekcia 3

Cena obsahu ako procesu

Manuálna práca

V hromadnom e-commerce spracovanie jednej karty bez automatizácie zvyčajne trvá 5–20 minút a priame náklady sa pohybujú v rozmedzí $1–5. Existujú aj zložitejšie kategórie, ale toto rozmedzie je pre bežný tok dát typické.

Scenár A
5 min
$1 / produktová karta
Scenár B
10 min
$3 / položka
Scenár C
20 min
$5 / položka
Infografika: čo znamená 1 000 SKU
A: 5 мин
≈ 83 hodiny
≈ $1 000
B: 10 мин
≈ 167 hodín
≈ $3 000
C: 20 мин
≈ 333 hodiny
≈ $5 000
A to je len počiatočné spracovanie. Aktualizácie tieto náklady opakujú znova a znova.
Ďalšia úroveň: manuálna kontrola
Pre malý podnik je typických 8 – 12 hodín manuálnej práce týždenne na kontrolu a úpravy. To predstavuje ekvivalent $10 000 – $18 000 ročných priamych nákladov na čas.
Režijné náklady na publikovanie produktu sa stávajú porovnateľné s logistikou. Tam, kde je optimalizovaná produktová logistika, často zostáva obsahová logistika manuálna a nekontrolovaná.
Cena chýb

Nekvalitné dáta vedú k merateľným stratám: 15 – 25 % tržieb sa stráca kvôli obsahu; až 25 % vrátenia tovaru súvisí s nesplnením očakávaní.

Zlé vyhľadávanie8–12%
Vrátenia tovaru / nezrovnalosti5–8%
Chyby v dátach a dostupnosti5–7%
Pruhy – vizualizácia podielov v rámci celkových strát (ilustratívne).
Čo „žerie“ čas
Zber dát
súbory / e-maily
Normalizácia
formáty / jednotky
Kvalita
kontroly / úpravy
Kanály
feedy / pravidlá
Každý účastník trhu je dnes sám sebe „elektráreň“ aj „elektrická sieť“. V zrelých odvetviach existujú samostatní poskytovatelia infraštruktúry. V obsahu e-commerce takáto vrstva takmer neexistuje – preto si každý robí všetko sám.
Sekcia 4

Malé podniky a veľkí hráči

Jeden problém – rôzne možnosti

Veľké spoločnosti si môžu vynucovať formáty u dodávateľov a investovať do infraštruktúry. Malé a stredné podniky sa musia častejšie prispôsobovať prichádzajúcim dátam a obmedzovať sortiment kvôli neschopnosti spracovať obsah.

Veľkí hráči
  • diktujú požiadavky dodávateľom
  • investujú do PIM a integrácií
  • udržiavajú tímy pre kvalitu dát
  • tolerujú chyby vďaka rozsahu
Malé / stredné podnikanie
  • pracuje vo formátoch dodávateľov
  • nemá rozpočet na infraštruktúru
  • obmedzuje sortiment kvôli obsahu
  • zverejňuje neúplné karty „tak ako sú“
Obsah sa stáva skrytou prekážkou rastu: nedostatok zdrojov znamená, že katalóg nerastie.
Infografika: Kde vládne formát
Veľkí
vyžadujú formát
Malí
prispôsobujú sa prichádzajúcim dátam
V digitálnej ekonomike sa rozsah podnikania čoraz častejšie určuje rozsahom dát. Ak katalóg nie je možné publikovať rýchlo a kvalitne, rast nie je obmedzený dopytom, ale operáciami.
Sekcia 5

Dodávatelia ako systémové úzke hrdlo

Dodávateľ – východiskový bod obsahu

Dodávatelia a výrobcovia sú prvotným zdrojom informácií o produktoch: špecifikácie, SKU, obrázky, balenie, certifikáty a technické popisy. Prítomnosť dát však neznamená, že sú pripravené na použitie trhom: dáta sú zriedka pripravené tak, aby bez straty prešli celým reťazcom až na výkladnú plochu (e-shop).

V logistike existujú štandardy a roly (prepravca, skladu, fulfillmentu). V dátach často chýbajú štandardy aj „sieťový operátor“: dodávateľ je nútený byť výrobcom dát aj ich integrátorom – bez adekvátnej infraštruktúry.

Kľúčový dôvod

Rôznorodosť formátov a bodov pravdy

Pre rovnaký sortiment má dodávateľ často viacero paralelných zdrojov: časť dát je v ERP, časť v tabuľkách, časť v PDF, časť v e-mailoch a schváleniach. Pre maloobchod sa to mení na neustále „dopĺňanie“, validáciu a manuálne opravy.

Infografika: Kde sa nachádzajú údaje dodávateľa
Systémy
ERP / sklad / cenník

Kódy, zásoby, balenie, časť atribútov.

Súbory
Excel / CSV

Šablóny pre klientov, manuálne úpravy.

Dokumenty
PDF / katalógy

Marketingové popisy a špecifikácie.

Komunikácia
e-maily / správy

Upresnenia, chýbajúce fotografie, výnimky.

Neštandardizované atribúty

Dodávatelia zvyčajne neprispôsobujú dáta jednotnému slovníku charakteristík trhu. Poskytujú to, čo majú: vlastné názvy polí, rôzne jednotky merania, rôzne úrovne podrobnosti. Preto sa „štandardizácia“ v skutočnosti vykonáva na strane maloobchodníka alebo marketplace.

Jeden význam Ako sa vyskytuje v dátach Čo robí retail
Farba Color / Colour / Col / Farba / Odtieň Mapuje, normalizuje
Veľkosť Veľkosť / Rozmery Zjednocuje jednotky a formát
Materiál Materiál / Zloženie Vytvára referenčné zoznamy hodnôt
Opakovanie: tisíce spoločností vykonávajú tú istú normalizáciu paralelne – a platia za ňu znova a znova.

Jeden dodávateľ – až 5–10 formátov

V praxi je dodávateľ, ktorý pracuje s veľkým počtom partnerov, nútený udržiavať **až 5–10 rôznych šablón** a systémov atribútov. Následne náklady na údržbu začnú rásť rýchlejšie ako výhody – a dodávateľ buď zníži kvalitu, alebo prejde k sprostredkovateľom, čím stratí kontrolu.

≈ do 5
Stále funguje

Manuálna podpora a zriedkavé aktualizácie.

≈ 5–10
Zóna preťaženia

Rastie riziko chýb a nesúladu dát.

≈ 10+
Zlyhanie škálovania

Vznikajú sprostredkovatelia a stráca sa kontrola.

Prečo sa dodávateľ nedokáže „prispôsobiť všetkým“

Dôvody zvyčajne nespočívajú v „neochote“, ale v ekonómii procesu: podpora viacerých formátov sa stáva samostatným produktom. Nižšie sú uvedené typické obmedzenia.

Dáta sú rozptýlené v rôznych zdrojoch

ERP systémy, cenníky, súbory, katalógy a komunikácia sú zriedka zjednotené do jednej štruktúry – chýba „jediný zdroj pravdy“.

Príliš veľa výnimiek podľa kategórií

Rôzne kategórie vyžadujú rôznu hĺbku a rôzne atribúty; univerzálna šablóna „pre všetko“ neexistuje.

Obmedzené IT zdroje a priority

Pre mnohých dodávateľov je „obsah“ vedľajším procesom k výrobe a predaju, a preto nedostáva systémové investície.

Rast počtu odberateľov násobí náklady na aktualizácie

Každá aktualizácia sa mení na reťazec rozosielania a úprav naprieč mnohými šablónami; nesúlad sa stáva normou.

Infografika: Degradácia dát na ceste

Od „suroviny“ k výkladu – cez straty a kopírovanie

Dodávateľ poskytuje „tak, ako je“
Vlastné polia, jednotky, verzie, nie vždy kompletná štruktúra.
Maloobchod to prepracováva
Mapovanie atribútov, normalizácia, kontrola kvality.
Kanály vyžadujú vlastné formáty
Feedy a obmedzenia vytvárajú ďalšie verzie dát.
Výsledok: trh platí za to isté opakovane
Stráca sa význam, práca sa duplikuje, aktualizácie cyklus opakujú nanovo.

Zhrnutie sekcie

Obsah od dodávateľov je „surovinou“ e-commerce. Trh s ním zaobchádza ako s hotovým produktom, hoci medzi surovinou a výkladom leží vrstva transformácie: slovníky, normalizácia, lokalizácia, kontrola kvality a aktualizácie.

Kým táto vrstva neexistuje ako infraštruktúra, každý účastník trhu si ju buduje sám – a preto sa problém nerieši lokálne.

Dodávateľ za chaos „nemôže“. Nemá motiváciu stať sa integrátorom celého trhu. Ale trh od neho systémovo vyžaduje presne toto.
Kto kontroluje formát
Veľké reťazce vyžadujú štandard
Malé obchody prijímajú prichádzajúce
Asymetria formátu prehlbuje rozdiel v kvalite dát medzi segmentmi.
V suchých metrikách
Verzií na SKU 25–200+
Kopírovanie v reťazci 3–5
Strata spôsobená dátami 15–25%
Čo vyžaduje trh
  • neutrálna vrstva transformácie dát
  • jednotné slovníky atribútov a jednotiek
  • automatizácia aktualizácií a kontroly kvality
Záver

Čo tieto čísla ukazujú

1) Obsah je logistika, ale bez priemyslu

V e-commerce sú peniaze a doručenie dávno industrializované. No produktové dáta sa stále presúvajú manuálne, fragmentovane a so stratami – v desiatkach verzií a formátov.

2) Problém je systémový – a preto sa nerieši „v rámci jednej spoločnosti“

Každý hráč je nútený budovať si vlastnú vrstvu transformácie dát: mapovanie atribútov, normalizácia, kontrola kvality, lokalizácia, feedy. Ale toto sa na úrovni trhu nemôže škálovať – práca sa duplikuje u tisícov spoločností súbežne.

3) Rozdiely medzi veľkými a malými hráčmi sa prehlbujú

Veľkí hráči môžu dodávateľom nanucovať formát a investovať do infraštruktúry. Menší sú často nútení publikovať „tak, ako to je“, obmedzovať sortiment a strácať efektivitu kvôli neschopnosti spracovať tok obsahu.

Prečo vznikol NotPIM Vnímame tento problém ako infraštruktúrny: trh potrebuje neutrálny medzičlánok, ktorý znižuje duplikáciu, obmedzuje straty dát a automatizuje content logistiku bez snahy „zlomiť trh pre seba“. Nie „ďalší výklad“, nie „ďalší formát“, ale spôsob, ako spájať účastníkov trhu na úrovni dát.
Kľúčové vyjadrenie
Trh potrebuje dátovú infraštruktúru – rovnako ako potrebuje logistickú infraštruktúru.

Preto riešenia „jednotlivca“ neprinášajú efekt škálovania, zatiaľ čo prístup na úrovni ekosystému áno.

Transparentnosť

Všetky hodnoty na stránke sú odhady rádov a typických rozsahov pre medzinárodný trh. Môžu sa líšiť v závislosti od krajín a kategórií, ale celková mechanika trhu (duplikovanie, straty, manuálna práca) zostáva nezmenená.

Údaje a hodnotenia na tejto stránke sú aktuálne k dátumu december 2025.