Le marché en chiffres • L'e-commerce en tant que marché de données

Le marché de l'e-commerce

le marché des données et du contenu

Nous avons l'habitude de mesurer l'e-commerce en commandes et en revenus. Mais derrière chaque commande se cache une infrastructure : caractéristiques, descriptions, images, formats, traductions et des validations sans fin. Cette page quantifie l'ampleur du marché en chiffres et en processus.

Chiffres clés
Ordres de grandeur
28 millions+
boutiques en ligne dans le monde
14 millions
dont aux États-Unis
350–600 millions
SKU chez les leaders du marché
15–25%
de pertes dues aux données
Un seul SKU se décline en des dizaines de versions de données : canaux de vente, langues, formats, exigences des plateformes.

Comment lire cette page

Cet article est volontairement détaillé. Nous ne réduisons pas le contenu à « quelques points clés », car l'ampleur du problème ne se révèle qu'à travers la combinaison de chiffres, de chaînes de processus et d'effets opérationnels.

Nous n'expliquons pas le fonctionnement des solutions et des technologies. D'autres pages sont dédiées à cela. Ici, nous présentons les fondements : comment le marché des données est structuré aujourd'hui et pourquoi il cesse d'être évolutif dans sa forme actuelle.

Approche
Chiffres + processus

Pas une « opinion », mais la mécanique observable du marché.

Focus
Logistique de contenu

Où le temps est gaspillé et où les données sont perdues.

Résultat
Comprendre l'échelle

Pourquoi c'est un problème systémique et non local.

Dans les années à venir, le coût de publication d'un produit en ligne sera égal, puis dépassera le coût de sa livraison physique. La logistique est optimisée depuis des décennies, tandis que la logistique de contenu reste manuelle et fragmentée.
Section 1

L'ampleur du marché des données

Nombre d'acteurs impliqués

Environ 28 millions de boutiques en ligne sont actives dans le monde. Parmi elles, environ 14 millions aux États-Unis, et plusieurs millions en Europe (par exemple, Royaume-Uni ≈ 1,1 million, Allemagne ≈ 0,7 million, France ≈ 0,6 million).

Outre la vente au détail, des millions de fabricants et de fournisseurs sont impliqués dans les chaînes de commerce électronique. Rien qu'en Europe, on compte environ 2,3 millions d'entreprises de fabrication qui fournissent potentiellement des données produits.

Monde
≈ 28 millions
sites de e-commerce
États-Unis
≈ 14 millions
environ 50 % du monde
Europe
millions
UK 1,1 / DE 0,7 / FR 0,6
Infographie : magasins par région (estimation)
échelle indicative
États-Unis
≈ 14 millions
Europe
≈ 5 à 7 millions
Reste du monde
≈ 7 à 9 millions
*L'Europe et le reste du monde représentent une estimation approximative de la répartition, car les différentes sources agrègent les sites de manière variée.
L'effet de levier principal
1 SKU → des dizaines de versions de données

Même si le produit est physiquement identique, il se multiplie numériquement : différents canaux de vente, différentes exigences des vitrines, différentes langues et formats.

Infographie : la formule
1 SKU × 5 à 10 canaux × 5 à 20 langues
= 25 à 200+ versions
Le même produit est produit numériquement des dizaines de fois. Chaque SKU est réécrit et recodé à chaque étape de la chaîne au lieu de devenir une source de données fiable une seule fois.
Nombre de SKU et de fiches produits
Type d'acteur Catalogue typique
Petite entreprise 100–1 000 SKU
Détaillant moyen 10 000–100 000 SKU
Grands détaillants 100 000–500 000 SKU
Marketplaces des centaines de millions de SKU
Les plus grandes plateformes ont des échelles différentes : 350 à 600 millions de SKU pour les leaders du marché.

Combien d'unités d'information existent

Si l'on prend en compte les langues, les formats et les canaux (site web, marketplaces, publicité, flux), le nombre d'unités d'information produit uniques (SKU × langue × format × canal) se chiffre en centaines de milliards de fragments de données.

À titre indicatif : les catalogues ouverts comme Icecat contiennent plus de 25 millions de fiches techniques en 77 langues — c'est une illustration de l'ampleur des versions multilingues.

Infographie : les multiplicateurs de complexité
SKU base
Langues 5–20
Canaux de vente 5–10
Formats / Exigences nombreux
Résultat : 25 à 200+ versions de données par produit (ordre de grandeur).
Jusqu'à 80 % du contenu produit dans l'e-commerce est encore transmis via Excel et des formats similaires. À l'ère des API, du cloud et de l'intelligence artificielle, le marché repose sur des pratiques datant des années 1990 : copier-coller manuel, erreurs et pertes de données à chaque étape.
Section 2

Chaîne de circulation du contenu

Où les données sont perdues

L'information produit va rarement directement du fabricant au client final. La chaîne typique est : fabricant → distributeur → fournisseur → magasin → CMS → marketing.

À chaque étape, les données sont transformées, les formats changent, une partie de l'information est supprimée et une autre est réécrite manuellement. Si le fabricant a défini environ 20 attributs, seuls 10 à 15 arrivent souvent jusqu'à la vitrine.

Infographie : les pertes tout au long de la chaîne
Fabricant
100%
Distributeur
80–90%
Fournisseur
70–80%
CMS
50–70%
Marketing
40–60%
Résultat : le même produit est souvent réécrit manuellement 3 à 5 fois par différents acteurs de la chaîne.
Ce qui se passe à chaque étape
Fabricant

Crée les données sources : attributs, références (SKU), images. Souvent, une seule version linguistique et des normes internes.

Distributeur / Fournisseur

Il transpose les données dans ses propres modèles, ajoute des champs (stocks/codes), perd les détails marketing, modifie le format.

Boutique / CMS

Importe dans sa propre structure, ajoute le SEO et les catégories. Le travail manuel introduit des fautes de frappe, des omissions et des incohérences.

Canaux / Marketing

Ils exigent des flux séparés et des contraintes de format. Toute divergence entraîne la non-publication du produit sur le canal ou des erreurs.

Le marché a automatisé depuis longtemps les paiements et la logistique, mais pas encore les données. Les paiements et les entrepôts fonctionnent comme une industrie, tandis que le contenu produit est traité comme un artisanat.
Infographie : où le sens se « perd »
Incompatibilité des formats élevé
Modifications manuelles élevé
Pertes sur les canaux Moyen
Évaluation qualitative : où les erreurs et les omissions se produisent le plus souvent.
Section 3

Le coût du contenu en tant que processus

Travail manuel

Dans l'e-commerce de masse, le traitement d'une seule fiche produit sans automatisation prend généralement 5 à 20 minutes, avec un coût direct se situant entre 1 $ et 5 $. Bien qu'il existe des catégories complexes, cette fourchette est typique pour un flux standard.

Scénario A
5 min
1 $ / fiche produit
Scénario B
10 min
3 $ / fiche produit
Scénario C
20 min
5 $ / fiche produit
Infographie : que représentent 1 000 SKU
A: 5 мин
≈ 83 heure
≈ $1 000
B: 10 мин
≈ 167 heures
≈ $3 000
C: 20 мин
≈ 333 heure
≈ $5 000
Et ce n'est que le traitement initial. Les mises à jour répètent ces coûts sans cesse.
Une autre échelle : la vérification manuelle
Pour les petites entreprises, 8 à 12 heures de travail manuel par semaine sont typiques pour la vérification et les corrections. Cela équivaut à des coûts horaires directs de 10 000 à 18 000 $ par an.
Les frais généraux de publication des produits deviennent comparables à ceux de la logistique. Là où la logistique des produits est optimisée, la logistique du contenu reste souvent manuelle et incontrôlée.
Le coût des erreurs

La mauvaise qualité des données entraîne des pertes mesurables : 15 à 25 % du chiffre d'affaires est perdu à cause du contenu ; jusqu'à 25 % des retours sont liés à une inadéquation avec les attentes.

Mauvaise recherche8–12%
Retours / Non-conformités5–8%
Erreurs de données et de stock5–7%
Les bandes représentent la visualisation des parts au sein des pertes totales (à titre indicatif).
Ce qui vous fait perdre du temps
Collecte des données
fichiers / e-mails
Normalisation
formats / unités
Qualité
vérifications / corrections
Canaux
flux / règles
Chaque acteur du marché est aujourd'hui à la fois sa propre « centrale électrique » et son propre « réseau de distribution ». Dans les industries matures, il existe des fournisseurs d'infrastructure dédiés. Dans le contenu e-commerce, cette couche est quasiment inexistante — obligeant chacun à tout gérer lui-même.
Section 4

Petites entreprises et grands acteurs

Un seul problème — des capacités différentes

Les grandes entreprises peuvent imposer des formats aux fournisseurs et investir dans l'infrastructure. Les PME sont plus souvent contraintes de s'adapter aux données entrantes et de limiter leur assortiment par incapacité à traiter le contenu.

Grands acteurs
  • imposent des exigences aux fournisseurs
  • investissent dans le PIM et les intégrations
  • maintiennent des équipes dédiées à la qualité des données
  • absorbent les erreurs grâce à leur échelle
Petites et moyennes entreprises
  • fonctionne avec les formats des fournisseurs
  • n'a pas de budget pour l'infrastructure
  • réduit son assortiment à cause du contenu
  • publie des fiches incomplètes «telles quelles»
Le contenu devient un obstacle caché à la croissance : manque de ressources — le catalogue ne s'étend pas.
Infographie : où réside le pouvoir du format
Les grands
exigent un format
Les petits
s'adaptent à ce qui est reçu
Dans l'économie numérique, l'échelle d'une entreprise est de plus en plus déterminée par l'échelle de ses données. Si le catalogue ne peut être publié rapidement et avec qualité, la croissance est limitée non par la demande, mais par les opérations.
Section 5

Les fournisseurs comme goulot d'étranglement systémique

Le fournisseur — point de départ du contenu

Les fournisseurs et les fabricants sont la source première des informations produits : caractéristiques, références (SKU), images, emballages, certifications et descriptions techniques. Mais la simple possession de données ne signifie pas qu'elles sont prêtes pour le marché : les données sont rarement structurées dès le départ pour traverser toute la chaîne jusqu'à la vitrine sans perte.

La logistique a ses normes et ses rôles (transporteur, entrepôt, fulfillment). Les données, elles, manquent souvent de normes et d'un « opérateur de réseau » : le fournisseur est contraint d'être à la fois le producteur des données et leur intégrateur, sans l'infrastructure adéquate.

La raison principale

Diversité des formats et des points de vérité

Pour un même assortiment, le fournisseur dispose souvent de plusieurs sources parallèles : une partie des données est dans l'ERP, une autre dans des tableurs, une autre en PDF, et le reste dans des e-mails et des validations. Pour le retail, cela se traduit par des « collectes complémentaires » constantes, des validations et des corrections manuelles.

Infographie : où résident les données du fournisseur
Systèmes
ERP / Stock / Prix

Codes, stocks, conditionnement, une partie des attributs.

Fichiers
Excel / CSV

Modèles pour clients, modifications manuelles.

Documents
PDF / Catalogues

Descriptions marketing et spécifications.

Communications
E-mails / Messageries

Clarifications, photos manquantes, exceptions.

Attributs non standardisés

Les fournisseurs n'alignent généralement pas leurs données sur un dictionnaire de caractéristiques standardisé pour le marché. Ils fournissent ce qu'ils ont : leurs propres noms de champs, des unités de mesure différentes, des niveaux de détail variés. Par conséquent, la « normalisation » est, en réalité, effectuée du côté du détaillant ou de la marketplace.

Un seul sens Tel qu'il apparaît dans les données Ce que fait le détaillant
Couleur Color / Colour / Col / Цвет / nuance Associe, normalise
Taille Taille / Dimensions Normalise les unités et le format
Matériau Matériau / Composition Crée des dictionnaires de valeurs
Répétition : Des milliers d'entreprises effectuent la même normalisation en parallèle — et paient pour cela sans cesse.

Un seul fournisseur — jusqu'à 5 à 10 formats

En pratique, un fournisseur travaillant avec un grand nombre de partenaires est obligé de maintenir **jusqu'à 5 à 10 modèles différents** et systèmes d'attributs. Ensuite, le coût de maintenance commence à croître plus vite que le bénéfice — et le fournisseur soit dégrade la qualité, soit se tourne vers des intermédiaires, perdant ainsi le contrôle.

≈ jusqu'à 5
Fonctionne encore

Support manuel et mises à jour rares.

≈ 5–10
Zone de surcharge

Le risque d'erreurs et de désynchronisation augmente.

≈ 10+
Échec de la mise à l'échelle

Apparition d'intermédiaires et perte de contrôle.

Pourquoi un fournisseur ne peut pas « s'adapter à tout le monde »

Les raisons ne tiennent généralement pas à une « mauvaise volonté », mais à l'économie du processus : la prise en charge de multiples formats devient un produit à part entière. Voici les limitations typiques.

Les données sont dispersées dans diverses sources

Les ERP, les listes de prix, les fichiers, les catalogues et les communications sont rarement regroupés dans une structure unique — la « source de vérité » est absente.

Trop d'exceptions par catégorie

Les différentes catégories exigent des niveaux de détail et des attributs variés ; il n'existe pas de modèle universel « passe-partout ».

Ressources informatiques et priorités limitées

Pour de nombreux fournisseurs, le « contenu » est un processus secondaire par rapport à la production et aux ventes, il ne bénéficie donc pas d'investissements systémiques.

L'augmentation du nombre de clients multiplie le coût des mises à jour

Chaque mise à jour se transforme en une chaîne d'envois et de corrections sur de nombreux modèles ; la désynchronisation devient la norme.

Infographie : dégradation des données en cours de route

De la « matière première » à la vitrine — par les pertes et les copies

Le fournisseur livre « tel quel »
Champs propriétaires, unités, versions, structure pas toujours complète.
Le détaillant retraite l'information
Mappage des attributs, normalisation, contrôle qualité.
Les canaux exigent leurs propres formats
Les flux et les contraintes créent des versions de données supplémentaires.
Résultat : le marché paie plusieurs fois pour la même chose
Le sens se perd, le travail est dupliqué, les mises à jour recommencent le cycle.

Conclusion de la section

Le contenu des fournisseurs est la «matière première» de l'e-commerce. Le marché le traite comme un produit fini, alors qu'une couche de transformation se situe entre cette matière première et la vitrine : dictionnaires, normalisation, localisation, contrôle qualité et mises à jour.

Tant que cette couche n'existe pas en tant qu'infrastructure, chaque acteur du marché la construit de manière autonome — et c'est pourquoi le problème n'est pas résolu localement.

Le fournisseur n'est pas à blâmer pour le chaos. Il n'a aucune incitation à devenir l'intégrateur de tout le marché. Pourtant, le marché lui impose systématiquement cette tâche.
Qui contrôle le format
Les grandes chaînes exigent un standard
Les petits magasins acceptent ce qui arrive
L'asymétrie des formats accentue l'écart de qualité des données entre les segments.
En chiffres bruts
Versions par SKU 25–200+
Copies en chaîne 3–5
Pertes dues aux données 15–25%
Ce que le marché exige
  • couche neutre de transformation des données
  • dictionnaires d'attributs et d'unités unifiés
  • automatisation des mises à jour et du contrôle qualité
Conclusion

Ce que ces chiffres révèlent

1) Le contenu, c'est de la logistique, mais sans l'industrie

Dans l'e-commerce, l'argent et la livraison sont industrialisés depuis longtemps. Pourtant, les données produits circulent encore manuellement, de manière fragmentée et avec des pertes — dans des dizaines de versions et de formats.

2) Le problème est systémique — et ne peut donc pas être résolu « au sein d'une seule entreprise »

Chaque acteur est obligé de construire sa propre couche de transformation des données : mappage des attributs, normalisation, contrôle qualité, localisation, flux (feeds). Mais cela ne se transpose pas à l'échelle du marché — le travail est dupliqué par des milliers d'entreprises simultanément.

3) L'écart entre les grands et les petits se creuse

Les grands acteurs peuvent imposer un format aux fournisseurs et investir dans l'infrastructure. Les plus petits sont souvent contraints de publier «tel quel», de réduire leur assortiment et de perdre en efficacité faute de pouvoir traiter le flux de contenu.

Pourquoi NotPIM a vu le jour Nous considérons ce problème comme étant structurel : le marché a besoin d'une couche neutre qui réduit la duplication, diminue les pertes de données et automatise la logistique de contenu sans chercher à « imposer sa loi au marché ». Pas « une vitrine de plus », pas « un format de plus », mais une manière de connecter les acteurs du marché au niveau des données.
L'énoncé clé
Le marché a besoin d'une infrastructure de données, tout comme il a besoin d'une infrastructure logistique.

C'est pourquoi les solutions « isolées » n'offrent pas d'effet d'échelle, contrairement à une approche de niveau écosystème.

Transparence

Toutes les valeurs présentées sur cette page sont des estimations d'ordres de grandeur et des fourchettes typiques sur le marché international. Elles peuvent varier selon les pays et les catégories, mais la mécanique générale du marché (doublons, pertes, travail manuel) demeure inchangée.

Les données et évaluations sur cette page sont à jour en date de décembre 2025.