Markkinat numeroina • Verkkokauppa datamarkkinana

Verkkokaupan markkina

data- ja sisältömarkkina

Olemme tottuneet mittaamaan verkkokauppaa tilauksilla ja liikevaihdolla. Mutta jokaisen tilauksen takana on infrastruktuuri: ominaisuudet, kuvaukset, kuvat, formaatit, käännökset ja loputtomat hyväksyntäprosessit. Tämä sivu kuvaa markkinan laajuutta numeroina ja prosesseina.

Keskeiset mittakaavat
suuruusluokkaa
28 miljoonaa+
verkkokauppaa maailmassa
14 miljoonaa
joista Yhdysvalloissa
350–600 miljoonaa
SKU:ta markkinajohtajilla
15–25%
tappioita datan vuoksi
Yksi SKU muuntuu kymmeniksi datan versioiksi: myyntikanavat, kielet, formaatit, alustojen vaatimukset.

Kuinka lukea tämä sivu

Tämä artikkeli on tarkoituksella yksityiskohtainen. Emme tiivistä materiaalia muutamaan iskulauseeseen, sillä ongelman laajuus paljastuu vain numeroiden, ketjujen ja operatiivisten vaikutusten yhdistelmänä.

Emme kuvaile ratkaisujen ja teknologioiden toimintaa. Sitä varten on olemassa toiset sivut. Tässä esitellään perusteet: miten datamarkkina on nykyään järjestetty ja miksi se nykymuodossaan lakkaa skaalautumasta.

Lähestymistapa
Luvut + prosessit

Ei ”mielipide”, vaan markkinoiden havaittavissa oleva mekaniikka.

Fokus
Sisältölogistiikka

Missä aikaa kuluu ja missä dataa katoaa.

Tulos
Skaalan ymmärtäminen

Miksi tämä on systeeminen eikä paikallinen tehtävä.

Lähivuosina tuotteen julkaisemisen kustannus verkossa tulee olemaan yhtä suuri kuin, ja sen jälkeen suurempi kuin, sen fyysisen toimituksen kustannus. Logistiikkaa on optimoitu vuosikymmeniä, mutta sisältölogistiikka on yhä manuaalista ja pirstaloitunutta.
Osa 1

Datamarkkinan laajuus

Osallistujien määrä

Maailmassa toimii noin 28 miljoonaa verkkokauppaa. Näistä noin 14 miljoonaa sijaitsee Yhdysvalloissa, ja Euroopassa niitä on useita miljoonia (esim. Iso-Britannia ≈ 1,1 miljoonaa, Saksa ≈ 0,7 miljoonaa, Ranska ≈ 0,6 miljoonaa).

Vähittäiskaupan lisäksi sähköisen kaupankäynnin ketjuihin on kytkeytynyt miljoonia valmistajia ja toimittajia. Pelkästään Euroopassa on noin 2,3 miljoonaa tuotantoyritystä, jotka potentiaalisesti toimittavat tuotetietoja.

Maailma
≈ 28 miljoonaa
verkkokauppaa
USA
≈ 14 miljoonaa
noin 50 % maailmasta
Eurooppa
miljoonia
UK 1,1 / DE 0,7 / FR 0,6
Infografiikka: Kaupat alueittain (suuntaa-antava)
mittakaava on suuntaa-antava
USA
≈ 14 miljoonaa
Eurooppa
≈ 5–7 miljoonaa
Muu maailma
≈ 7–9 miljoonaa
*Eurooppa ja muu maailma ovat karkeita arvioita jakautumasta, sillä eri lähteet kokoavat verkkokauppoja eri tavoin.
Keskeinen skaalaetu
1 tuote (SKU) → kymmeniä datan versioita

Vaikka tuote olisi fyysisesti sama, digitaalisesti se monistuu: eri myyntikanavat, eri vaatimukset esittelytavoille, eri kielet ja formaatit.

Infografiikka: kaava
1 SKU × 5–10 kanavaa × 5–20 kieltä
= 25–200+ versiota
Samaa tuotetta digitaalisessa muodossa luodaan kymmeniä kertoja. Yhtä tuotetunnusta (SKU) kirjoitetaan ja koodataan uudelleen jokaisessa toimitusketjun vaiheessa sen sijaan, että siitä tehtäisiin kerran luotettava tietolähde.
SKU-tunnusten ja tuotekorttien määrä
Toimijan tyyppi Tyypillinen tuoteluettelo
Pienyritys 100–1 000 SKU
Keskikokoinen jälleenmyyjä 10 000–100 000 SKU
Suuret jälleenmyyjät 100 000–500 000 SKU
Markkinapaikat satoja miljoonia SKU-tunnuksia
Suurimmilla alustoilla mittakaavat ovat erilaiset: markkinajohtajilla on 350–600 miljoonaa SKU-tunnusta.

Kuinka monta tietoyksikköä on olemassa

Kun otetaan huomioon kielet, formaatit ja kanavat (verkkosivusto, markkinapaikat, mainonta, syötteet), ainutlaatuisten tuotetietoyksiköiden (SKU × kieli × formaatti × kanava) määrä nousee satoihin miljardeihin datanpätkiin.

Vertailun vuoksi: avoimet katalogit, kuten Icecat, sisältävät yli 25 miljoonaa tuotetietolomaketta (datasheet) 77 kielellä – tämä havainnollistaa monikielisten versioiden mittakaavaa.

Infografiikka: monimutkaisuuden kertoimet
SKU perusta
Kielet 5–20
Myyntikanavat 5–10
Muodot / vaatimukset paljon
Yhteenveto: 25–200+ versiota tietoa yhdestä tuotteesta (suuruusluokkaa).
Jopa 80 % verkkokaupan tuotesisällöstä siirretään edelleen Excelin ja vastaavien formaattien kautta. API:en, pilvipalveluiden ja tekoälyn aikakaudella markkinat nojaavat 1990-luvun käytäntöihin: manuaaliseen kopiointiin, virheisiin ja tietojen menetyksiin jokaisessa vaiheessa.
Osa 2

Sisällön kulkuketju

Missä tiedot katoavat

Tuotetiedot etenevät harvoin suoraan valmistajalta ostajalle. Tyypillinen ketju on: valmistaja → tukkuri → toimittaja → kauppa → CMS → markkinointi.

Jokaisessa vaiheessa tietoa muunnetaan, formaatit vaihtuvat, osa tiedoista karsiutuu ja osa kirjoitetaan käsin uudelleen. Jos valmistaja on määrittänyt noin 20 ominaisuutta, myyntipisteeseen päätyy usein vain 10–15.

Infografiikka: hävikki toimitusketjussa
Valmistaja
100%
Jälleenmyyjä
80–90%
Toimittaja
70–80%
CMS
50–70%
Markkinointi
40–60%
Yhteenveto: sama tuote kirjoitetaan usein käsin uudelleen 3–5 kertaa ketjun eri toimijoiden toimesta.
Mitä vaiheissa tapahtuu
Valmistaja

Luo lähdetiedot: ominaisuudet, tuotenumerot, kuvat. Usein vain yksi kieliversio ja sisäiset standardit.

Jälleenmyyjä / toimittaja

Siirtää tiedot omiin malleihinsa, lisää kenttiä (varastosaldo/koodit), menettää markkinointitiedot, muuttaa formaattia.

Verkkokauppa / CMS

Tuo tiedot omaan rakenteeseensa, lisää SEO-tiedot ja kategoriat. Manuaalisessa työssä syntyy kirjoitusvirheitä, puutteita ja epäjohdonmukaisuuksia.

Kanavat / markkinointi

Vaativat erilliset syötteet ja formaattirajoitukset. Mikä tahansa epäjohdonmukaisuus johtaa tuotteen julkaisematta jäämiseen kanavassa tai virheisiin.

Markkinat ovat jo kauan sitten automatisoineet maksut ja toimitukset, mutta eivät ole vieläkään automatisoineet tuotetietoja. Maksuliikenne ja varastot toimivat teollisuuden tavoin, mutta tuotesisältö on edelleen käsityötä.
Infografiikka: missä merkitys 'katoaa'
Formaattien yhteensopimattomuus korkea
Manuaaliset muokkaukset korkea
Hävikki kanavissa keskiverto
Laadullinen arviointi: missä virheitä ja puutteita esiintyy useimmin.
Osa 3

Sisällön kustannukset prosessina

Manuaalinen työ

Massiivisessa verkkokaupassa yhden tuotekortin käsittely ilman automaatiota vie tyypillisesti 5–20 minuuttia, ja suorat kustannukset ovat välillä 1–5 dollaria. On olemassa myös monimutkaisempia kategorioita, mutta tämä vaihteluväli on tyypillinen tuotemassalle.

Skenaario A
5 min
1 $ / tuotekortti
Skenaario B
10 min
$3 / tuotekortti
Skenaario C
20 min
$5 / tuotekortti
Infografiikka: Mitä 1 000 SKU:ta tarkoittaa
A: 5 мин
≈ 83 tunti
≈ $1 000
B: 10 мин
≈ 167 tuntia
≈ $3 000
C: 20 мин
≈ 333 tunti
≈ $5 000
Ja tämä on vasta ensikäsittely. Päivitykset toistavat nämä kustannukset yhä uudelleen.
Toinen mittakaava: manuaalinen täsmäytys
Pienyrityksillä kuluu tyypillisesti 8–12 tuntia viikossa manuaaliseen täsmäytykseen ja korjauksiin. Tämä vastaa 10 000–18 000 dollarin suoria aikakustannuksia vuodessa.
Tuotteen julkaisun yleiskustannukset alkavat olla verrattavissa logistiikkaan. Siellä, missä tuotelogiikka on optimoitu, sisältölogiikka jää usein manuaaliseksi ja hallitsemattomaksi.
Virheiden hinta

Huono datan laatu johtaa mitattaviin menetyksiin: 15–25 % liikevaihdosta menetetään sisällön vuoksi; jopa 25 % palautuksista johtuu odotusten täyttymättömyydestä.

Huono haku8–12%
Palautukset / epäjohdonmukaisuudet5–8%
Data- ja saatavuusvirheet5–7%
Palkit – osuuksien visualisointi kokonaishäviöiden sisällä (viitteellisesti).
Mikä vie aikaa
Tiedonkeruu
tiedostot / sähköpostit
Normalisointi
formaatit / yksiköt
Laatu
tarkistukset / korjaukset
Kanavat
syötteet / säännöt
Jokainen markkinatoimija on tänään sekä oma 'voimalaitoksensa' että 'sähköverkko'. Kypsillä toimialoilla on erillisiä infrastruktuurin tarjoajia. Verkkokaupan sisällössä tällaista kerrosta ei juuri ole – siksi jokainen tekee kaiken itse.
Osa 4

Pienyritykset ja suuret toimijat

Yksi ongelma – erilaiset resurssit

Suuret yritykset voivat sanelevat muotovaatimuksia toimittajille ja investoivat infrastruktuuriin. Pienet ja keskisuuret yritykset joutuvat useammin mukautumaan saapuvaan dataan ja rajoittamaan valikoimaansa sisällön käsittelykyvyttömyyden vuoksi.

Suuret toimijat
  • asettavat vaatimuksia toimittajille
  • investoivat PIM-järjestelmiin ja integraatioihin
  • ylläpitävät datan laadun tiimejä
  • sietävät virheitä skaalan turvin
Pienet / keskisuuret yritykset
  • toimii toimittajien formaateissa
  • ei ole budjettia infrastruktuurille
  • karsii valikoimaa sisällön vuoksi
  • julkaisut puutteellisia tuotekortteja sellaisenaan
Sisällöstä tulee kasvun piiloinen este: resurssien puute estää katalogin kasvun.
Infografiikka: missä formaatin valta on
Suuret
vaativat formaatin
Pienet
mukautuvat saapuvaan
Digitaalisessa taloudessa yrityksen mittakaavaa määrittää yhä useammin datan mittakaava. Jos tuoteluetteloa ei voida julkaista nopeasti ja laadukkaasti, kasvua rajoittaa kysynnän sijaan operatiivinen suorituskyky.
Osa 5

Toimittajat järjestelmän pullonkaulana

Toimittaja on sisällön lähtöpiste

Tavarantoimittajat ja valmistajat ovat tuotetietojen ensisijainen lähde: ominaisuudet, artikkelinumerot, kuvat, pakkaustiedot, sertifikaatit ja tekniset kuvaukset. Tietojen olemassaolo ei kuitenkaan tarkoita, että ne olisivat valmiita markkinakäyttöön: tiedot on harvoin alun perin koottu siten, että ne läpäisevät koko ketjun myymälään ilman menetyksiä.

Logistiikassa on standardeja ja rooleja (kuljetusliike, varasto, täydennyspalvelu). Dataa hallitsevilta puuttuvat usein standardit ja "verkon operaattori": toimittaja joutuu olemaan sekä tietojen tuottaja että niiden integroija – ilman asianmukaista infrastruktuuria.

Keskeinen syy

Formaattien ja totuuden pisteiden monimuotoisuus

Samasta valikoimasta toimittajalla on usein useita rinnakkaisia lähteitä: osa tiedoista on ERP-järjestelmässä, osa taulukoissa, osa PDF-tiedostoissa, osa sähköposteissa ja hyväksynnöissä. Jälleenmyyjälle tämä muuttuu jatkuvaksi "täydennykseksi", validointiin ja manuaalisiin korjauksiin.

Infografiikka: mistä toimittajan tiedot löytyvät
Järjestelmät
ERP / varasto / hinnasto

Koodit, varastosaldo, pakkaustiedot, osa attribuuteista.

Tiedostot
Excel / CSV

Asiakaskohtaiset mallit, manuaaliset muokkaukset.

Dokumentit
PDF / katalogit

Markkinointitekstit ja tekniset tiedot.

Viestintä
Sähköpostit / viestit

Tarkennukset, puuttuvat kuvat, poikkeukset.

Epästandardoidut attribuutit

Toimittajat eivät yleensä sovita tietojaan markkinoiden yhtenäiseen ominaisuussanastoon. He antavat sen, mitä heillä on: omat kenttien nimensä, erilaiset mittayksiköt ja eri yksityiskohtaisuuden tasot. Siksi ”standardointi” tehdään käytännössä jälleenmyyjän tai markkinapaikan puolella.

Yksi merkitys Miten esiintyy datassa Mitä jälleenmyyjä tekee
Väri Color / Colour / Col / Väri / Sävy Vastaa, normalisoi
Koko Koko / Mitat Määrittää yksiköt ja muodon
Materiaali Materiaali / Koostumus Luo arvojen viiteoppaita
Toistuvuus: tuhannet yritykset tekevät saman normalisoinnin rinnakkain – ja maksavat siitä yhä uudelleen.

Yksi toimittaja – jopa 5–10 eri formaattia

Käytännössä toimittajan, joka työskentelee suuren kumppanimäärän kanssa, on ylläpidettävä **jopa 5–10 erilaista mallia** ja attribuuttijärjestelmää. Tämän jälkeen ylläpitokustannukset alkavat kasvaa nopeammin kuin hyöty – jolloin toimittaja joko heikentää laatua tai siirtyy käyttämään välikäsiä menettäen samalla kontrollin.

≈ enintään 5
Toimii vielä

Manuaalinen tuki ja harvat päivitykset.

≈ 5–10
Ylikuormitusvyöhyke

Virheiden ja epäsynkronoinnin riski kasvaa.

≈ 10+
Skaalautumisen epäonnistuminen

Välikädet ja kontrollin menetys alkavat.

Miksi toimittaja ei voi ”mukautua kaikkiin”

Syyt eivät yleensä johdu "haluttomuudesta", vaan prosessin taloudesta: useiden formaattien ylläpito muuttuu erilliseksi tuotteeksi. Alla on tyypillisiä rajoituksia.

Data on hajallaan eri lähteissä

ERP-järjestelmät, hinnastot, tiedostot, katalogit ja viestintä harvoin kootaan yhtenäiseksi rakenteeksi – ”totuuden lähde” puuttuu.

Liian monta poikkeusta kategorioittain

Eri kategoriat vaativat erilaista syvyyttä ja eri attribuutteja; yleispätevää ”kaiken kattavaa” mallia ei ole olemassa.

Rajoitetut IT-resurssit ja prioriteetit

Monille toimittajille ”sisältö” on tuotannon ja myynnin oheisprosessi, minkä vuoksi siihen ei kohdenneta järjestelmällisiä investointeja.

Asiakasmäärän kasvu moninkertaistaa päivitysten kustannukset

Jokainen päivitys muuttuu sähköpostiketjuksi ja korjauksiksi useiden mallien läpi; epäsynkronisuus muuttuu normiksi.

Infografiikka: Tietojen heikkeneminen matkan varrella

Raaka-aineesta myyntinäyttämölle – menetysten ja kopioinnin kautta

Toimittaja antaa tiedot "sellaisenaan"
Omat kentät, yksiköt, versiot, rakenne ei aina täydellinen.
Jälleenmyyjä käsittelee uudelleen
Attribuuttien yhdistäminen, normalisointi, laadunvalvonta.
Kanavat vaativat omat formaattinsa
Syötteet ja rajoitukset luovat lisäversioita tiedoista.
Lopputulos: markkinat maksavat samasta asiasta useita kertoja
Merkitys katoaa, työtä tehdään päällekkäin, päivitykset toistavat syklin uudelleen.

Yhteenveto osiosta

Toimittajien sisältö on verkkokaupan "raaka-ainetta". Markkinat kohtelevat sitä kuin valmista tuotetta, vaikka raaka-aineen ja myyntivitriinin välissä on muunnoskerros: sanakirjat, normalisointi, lokalisointi, laadunvalvonta ja päivitykset.

Niin kauan kuin tätä kerrosta ei ole olemassa infrastruktuurina, jokainen markkinatoimija rakentaa sen itse – ja siksi ongelma ei ratkea paikallisesti.

Toimittaja ei ole syyllinen kaaokseen. Hänellä ei ole kannustinta toimia koko markkinan integraattorina. Mutta markkinat vaativat häneltä järjestelmällisesti juuri tätä.
Kuka hallitsee formaattia
Suuret ketjut vaativat standardia
Pienet kaupat hyväksyvät saapuvan datan
Formaatin epäsymmetria syventää datan laatueroa eri segmenttien välillä.
Kuivissa mittareissa
Versioita per SKU 25–200+
Ketjutettu kopiointi 3–5
Tietojen aiheuttamat menetykset 15–25%
Mitä markkinat vaativat
  • neutraali datan muunnoskerros
  • yhtenäiset attribuuttisanastot ja yksiköt
  • päivitysten ja laadunvalvonnan automatisointi
Lopputulos

Mitä nämä luvut osoittavat

1) Sisältö on logistiikkaa, mutta ilman toimialaa

Verkkokaupassa raha ja toimitus on jo kauan sitten teollistettu. Tuotetiedot liikkuvat kuitenkin edelleen manuaalisesti, pirstaleisesti ja menetyksin – kymmenissä eri versioissa ja formaateissa.

2) Ongelma on systeeminen – eikä siksi ratkea ”yhden yrityksen sisällä”

Jokaisen toimijan on rakennettava oma tietojen muunnoskerroksensa: attribuuttien yhdistäminen, normalisointi, laadunvalvonta, lokalisointi, syötteet. Tämä ei kuitenkaan skaalaudu markkinatasolla – työ toistuu tuhansissa yrityksissä samanaikaisesti.

3) Kuilu suurten ja pienten välillä kasvaa

Suuret toimijat voivat saneella formaatin toimittajille ja investoida infrastruktuuriin. Pienemmät joutuvat usein julkaisemaan sisällön "sellaisenaan", karsimaan valikoimaa ja menettämään tehokkuutta kyvyttömyyden vuoksi käsitellä sisältövirtaa.

Miksi NotPIM syntyi Näemme tämän ongelman infrastruktuuriongelmana: markkinat tarvitsevat neutraalin kerroksen, joka vähentää päällekkäisyyksiä, pienentää tietohävikkiä ja automatisoi sisältölogistiikan yrittämättä "taivuttaa markkinaa omiin tarpeisiin". Ei "vielä yksi myynti-ikkuna" eikä "vielä yksi formaatti", vaan tapa yhdistää markkinatoimijat datatasolla.
Keskeinen muotoilu
Markkinat tarvitsevat datainfrastruktuuria – aivan kuten ne tarvitsevat logistiikkainfrastruktuuria.

Siksi yksittäiset ratkaisut eivät tarjoa skaalaetua, mutta ekosysteemitasoinen lähestymistapa tarjoaa.

Läpinäkyvyys

Kaikki sivulla esitetyt arvot ovat suuruusluokka-arvioita ja tyypillisiä vaihteluvälejä kansainvälisillä markkinoilla. Ne voivat vaihdella maittain ja tuotekategorioittain, mutta markkinoiden yleinen mekaniikka (duplikaatit, häviöt, manuaalinen työ) pysyy samana.

Tämän sivun tiedot ja arviot ovat ajantasaisia joulukuun 2025 tilanteen mukaan.