El mercado en cifras • E-commerce como mercado de datos

Mercado de e-commerce

mercado de datos y contenido

Estamos acostumbrados a medir el e-commerce en pedidos e ingresos. Pero detrás de cada pedido hay una infraestructura: atributos, descripciones, imágenes, formatos, traducciones y negociaciones interminables. Esta página refleja la magnitud del mercado en cifras y procesos.

Magnitudes clave
órdenes de magnitud
28 millones+
tiendas online en el mundo
14 millones
de ellas en EE. UU.
350–600 millones
SKU de los líderes del mercado
15–25%
pérdidas debido a datos
Un SKU se convierte en docenas de versiones de datos: canales de venta, idiomas, formatos, requisitos de las plataformas.

Cómo leer esta página

Este artículo es intencionadamente detallado. No reducimos el material a «unos pocos puntos clave», porque la magnitud del problema solo se revela a través de la combinación de cifras, cadenas de procesos y efectos operativos.

No describimos cómo funcionan las soluciones y tecnologías. Para eso hay otras páginas. Aquí están los fundamentos: cómo está estructurado el mercado de datos hoy y por qué en su forma actual deja de ser escalable.

Enfoque
Datos + procesos

No es una «opinión», sino la mecánica observable del mercado.

Foco
Logística de contenido

Dónde se pierde tiempo y dónde se pierden datos.

Resultado
Comprensión de la escala

Por qué es un problema sistémico y no local.

En los próximos años, el coste de publicar un producto en línea se igualará y luego superará el coste de su envío físico. La logística se ha optimizado durante décadas, mientras que la logística de contenido sigue siendo manual y fragmentada.
Sección 1

Escala del mercado de datos

Cuántos participantes están involucrados

Hay aproximadamente 28 millones de tiendas online operando en el mundo. De ellas, unas 14 millones están en EE. UU., y varios millones en Europa (por ejemplo, Reino Unido ≈ 1,1 millones, Alemania ≈ 0,7 millones, Francia ≈ 0,6 millones).

Además del comercio minorista, millones de fabricantes y proveedores están involucrados en las cadenas de comercio electrónico. Solo en Europa, hay alrededor de 2,3 millones de empresas de fabricación que potencialmente suministran datos de productos.

Mundo
≈ 28 millones
sitios de e-commerce
EE. UU.
≈ 14 millones
alrededor del 50% del mundo
Europa
millones
UK 1,1 / DE 0,7 / FR 0,6
Infografía: tiendas por región (aproximado)
escala aproximada
EE. UU.
≈ 14 millones
Europa
≈ 5–7 millones
Resto del mundo
≈ 7–9 millones
*Europa y el resto del mundo son estimaciones aproximadas de la distribución, ya que diferentes fuentes agregan sitios web de manera distinta.
El efecto de escala clave
1 SKU → docenas de versiones de datos

Incluso si el producto es físicamente el mismo, en el ámbito digital se multiplica: diferentes canales de venta, distintos requisitos de escaparate, diferentes idiomas y formatos.

Infografía: la fórmula
1 SKU × 5–10 canales × 5–20 idiomas
= 25–200+ versiones
El mismo producto en formato digital se produce docenas de veces. Un SKU se reescribe y recodifica en cada paso de la cadena, en lugar de convertirse una sola vez en una fuente de datos fiable.
Cuántos SKU y fichas de producto
Tipo de actor Catálogo típico
Pequeña empresa 100–1 000 SKU
Minorista promedio 10 000–100 000 SKU
Grandes minoristas 100 000–500 000 SKU
Marketplaces cientos de millones de SKU
Las plataformas más grandes tienen una escala diferente: los líderes del mercado manejan entre 350 y 600 millones de SKU.

Cuántas unidades de información existen

Si consideramos idiomas, formatos y canales (sitio web, marketplaces, publicidad, feeds), la cantidad de unidades únicas de información de producto (SKU × idioma × formato × canal) se mide en cientos de miles de millones de fragmentos de datos.

A modo de referencia: catálogos abiertos como Icecat contienen más de 25 millones de fichas de datos en 77 idiomas, lo que ilustra la magnitud de las versiones multilingües.

Infografía: multiplicadores de complejidad
SKU base
Idiomas 5–20
Canales de venta 5–10
Formatos / requisitos Muchos
Resultado: 25–200+ versiones de datos por producto (órdenes de magnitud).
Hasta el 80% del contenido de producto en e-commerce todavía se transfiere a través de Excel y formatos similares. En la era de las API, la nube y la inteligencia artificial, el mercado se basa en prácticas de los años 90: copias manuales, errores y pérdidas de datos en cada paso.
Sección 2

Cadena de flujo del contenido

Dónde se pierden los datos

La información del producto rara vez va directamente del fabricante al comprador. La cadena típica es: fabricante → distribuidor → proveedor → tienda → CMS → marketing.

En cada etapa, los datos se transforman, los formatos cambian, parte de la información se descarta y otra parte se reescribe manualmente. Si el fabricante definió unas 20 características, a menudo solo llegan a la tienda entre 10 y 15.

Infografía: pérdidas a lo largo de la cadena
Fabricante
100%
Distribuidor
80–90%
Proveedor
70–80%
CMS
50–70%
Marketing
40–60%
Resultado: el mismo producto a menudo se reescribe manualmente entre 3 y 5 veces por diferentes actores de la cadena.
Qué sucede en cada etapa
Fabricante

Crea los datos fuente: características, referencias (SKU), imágenes. A menudo, una sola versión de idioma y estándares internos.

Distribuidor / Proveedor

Transfiere los datos a sus propias plantillas, añade campos (stock/códigos), pierde detalles de marketing y cambia el formato.

Tienda / CMS

Importa a su estructura, añade SEO y categorías. El trabajo manual introduce erratas, omisiones e inconsistencias.

Canales / Marketing

Exigen feeds separados y restricciones de formato. Cualquier discrepancia resulta en que el producto no se publique en el canal o en errores.

El mercado ha automatizado el dinero y la logística desde hace tiempo, pero aún no ha automatizado los datos. Los pagos y los almacenes funcionan como una industria, mientras que el contenido de producto sigue siendo un oficio.
Infografía: dónde se 'pierde' el significado
Incompatibilidad de formatos alto
Ediciones manuales alto
Pérdidas en los canales media
Evaluación cualitativa: dónde surgen con mayor frecuencia errores y omisiones.
Sección 3

El coste del contenido como proceso

Trabajo manual

En el comercio electrónico masivo, el procesamiento de una sola ficha de producto sin automatización suele tardar entre 5 y 20 minutos, con un coste directo que oscila entre $1 y $5. Hay categorías más complejas, pero este rango es típico para el flujo de trabajo.

Escenario A
5 min
$1 / ficha de producto
Escenario B
10 min
$3 / ficha de producto
Escenario C
20 min
$5 / ficha de producto
Infografía: qué significan 1000 SKU
A: 5 мин
≈ 83 hora
≈ $1 000
B: 10 мин
≈ 167 horas
≈ $3 000
C: 20 мин
≈ 333 hora
≈ $5 000
Y esto es solo el procesamiento inicial. Las actualizaciones repiten estos costes una y otra vez.
Otra escala: la conciliación manual
Para las PYMES, son típicas 8 a 12 horas de trabajo manual semanal en conciliación y correcciones. Esto equivale a un coste directo de tiempo de $10 000 a $18 000 al año.
Los gastos generales de publicación de productos se vuelven comparables a los de la logística. Donde la logística de productos está optimizada, la logística de contenido a menudo sigue siendo manual y descontrolada.
El coste de los errores

La mala calidad de los datos provoca pérdidas medibles: se pierde un 15-25% de los ingresos debido al contenido; hasta un 25% de las devoluciones se deben a la discrepancia con las expectativas.

Búsqueda deficiente8–12%
Devoluciones / Discrepancias5–8%
Errores de datos y stock5–7%
Las franjas son una visualización de las proporciones dentro de las pérdidas totales (ilustrativo).
Lo que consume tiempo
Recolección de datos
archivos / correos
Normalización
formatos / unidades
Calidad
revisiones / correcciones
Canales
feeds / reglas
Cada actor del mercado es hoy su propia 'central eléctrica' y su propia 'red eléctrica'. En las industrias maduras existen proveedores de infraestructura dedicados. En el contenido de e-commerce, casi no existe esa capa, por eso cada uno hace todo por su cuenta.
Sección 4

Pequeñas empresas y grandes actores

Un problema, diferentes capacidades

Las grandes empresas pueden imponer formatos a los proveedores e invertir en infraestructura. Las PYMES a menudo se ven obligadas a adaptarse a los datos entrantes y limitar su surtido debido a la incapacidad de procesar el contenido.

Grandes actores
  • imponen requisitos a los proveedores
  • invierten en PIM e integraciones
  • mantienen equipos de calidad de datos
  • absorben errores gracias a la escala
Pequeña / mediana empresa
  • Funciona con los formatos de los proveedores
  • No tiene presupuesto para infraestructura
  • Reduce el surtido debido al contenido
  • Publica fichas incompletas 'tal cual'
El contenido se convierte en una barrera oculta para el crecimiento: si faltan recursos, el catálogo no crece.
Infografía: dónde reside el poder del formato
Grandes
Exigen un formato
Pequeñas
Se adaptan a lo entrante
En la economía digital, la escala de un negocio está determinada cada vez más por la escala de sus datos. Si el catálogo no se puede publicar de forma rápida y de alta calidad, el crecimiento se limita no por la demanda, sino por las operaciones.
Sección 5

Los proveedores como cuello de botella sistémico

El proveedor es el punto de partida del contenido

Los proveedores y fabricantes son la fuente original de la información del producto: características, referencias (SKU), imágenes, embalaje, certificados y descripciones técnicas. Pero la existencia de datos no significa que estén listos para el mercado: rara vez los datos se recopilan inicialmente de manera que puedan pasar toda la cadena hasta el escaparate sin pérdidas.

En logística existen estándares y roles (transportista, almacén, fulfillment). En los datos, a menudo faltan tanto estándares como un «operador de red»: el proveedor se ve obligado a ser tanto el productor de los datos como su integrador, y esto ocurre sin la infraestructura adecuada.

La razón clave

Diversidad de formatos y puntos de verdad

Para el mismo surtido, el proveedor a menudo tiene varias fuentes paralelas: parte de los datos está en el ERP, parte en hojas de cálculo, parte en PDF, y parte en correos electrónicos y acuerdos. Para el comercio minorista, esto se traduce en constantes «recopilaciones adicionales», validación y correcciones manuales.

Infografía: Dónde residen los datos del proveedor
Sistemas
ERP / Almacén / Lista de precios

Códigos, stock, embalaje, parte de los atributos.

Archivos
Excel / CSV

Plantillas para clientes, ediciones manuales.

Documentos
PDF / Catálogos

Descripciones de marketing y especificaciones.

Comunicaciones
Correos electrónicos / Mensajería

Aclaraciones, fotos faltantes, exclusiones.

Atributos no estandarizados

Los proveedores generalmente no estandarizan los datos según un diccionario de atributos común del mercado. Suministran lo que tienen: sus propios nombres de campos, diferentes unidades de medida y distintos niveles de detalle. Por lo tanto, la «normalización» se realiza, de hecho, en el lado del minorista o del marketplace.

Un único significado Tal como aparece en los datos Lo que hace el retail
Color Color / Colour / Col / Цвет / Tono Mapea, normaliza
Talla Tamaño / Dimensiones Estandariza unidades y formato
Material Material / Composición Crea diccionarios de valores
Repetición: miles de empresas realizan la misma normalización en paralelo y pagan por ello una y otra vez.

Un proveedor: hasta 5-10 formatos

En la práctica, un proveedor que trabaja con muchos socios se ve obligado a mantener **hasta 5 o 10 plantillas diferentes** y sistemas de atributos. A partir de ahí, el coste de mantenimiento empieza a crecer más rápido que el beneficio, y el proveedor reduce la calidad o recurre a intermediarios, perdiendo el control.

≈ hasta 5
Aún funciona

Soporte manual y actualizaciones esporádicas.

≈ 5–10
Zona de sobrecarga

El riesgo de errores y desincronización aumenta.

≈ 10+
Fallo en la escalabilidad

Aparecen intermediarios y se pierde el control.

Por qué un proveedor no puede «adaptarse a todos»

Las razones no suelen ser por «falta de voluntad», sino por la economía del proceso: mantener múltiples formatos se convierte en un producto en sí mismo. A continuación, se presentan las limitaciones típicas.

Los datos están dispersos en diferentes fuentes

Los ERP, listas de precios, archivos, catálogos y comunicaciones rara vez se consolidan en una única estructura; falta una 'fuente única de verdad'.

Demasiadas excepciones por categoría

Las diferentes categorías requieren distinta profundidad y atributos; no existe una plantilla universal 'para todo'.

Recursos de TI limitados y prioridades

Para muchos proveedores, el 'contenido' es un proceso secundario en relación con la producción y las ventas, por lo que no recibe inversión sistémica.

El crecimiento de clientes multiplica el coste de las actualizaciones

Cada actualización se convierte en una cadena de envíos y correcciones a través de múltiples plantillas; la falta de sincronización se convierte en la norma.

Infografía: degradación de los datos en el camino

Del 'dato crudo' al escaparate: a través de pérdidas y copias

El proveedor entrega los datos 'tal cual'
Campos propios, unidades, versiones, estructura no siempre completa.
El minorista reprocesa
Mapeo de atributos, normalización, control de calidad.
Los canales exigen sus propios formatos
Los feeds y las restricciones crean versiones de datos adicionales.
Resultado: el mercado paga varias veces por lo mismo
Se pierde el significado, el trabajo se duplica, las actualizaciones repiten el ciclo desde cero.

Conclusión de la sección

El contenido de los proveedores es la «materia prima» del e-commerce. El mercado lo trata como si fuera un producto final, aunque entre la materia prima y el escaparate existe una capa de transformación: diccionarios, normalización, localización, control de calidad y actualizaciones.

Mientras esta capa no exista como infraestructura, cada actor del mercado la construye de forma independiente, y por eso el problema no se resuelve de forma local.

El proveedor no es el 'culpable' del caos. No tiene incentivos para convertirse en el integrador de todo el mercado. Pero el mercado sistémicamente le exige precisamente eso.
Quién controla el formato
Grandes cadenas exigen un estándar
Pequeñas tiendas aceptan lo entrante
La asimetría del formato amplía la brecha de calidad de los datos entre los segmentos.
En métricas objetivas
Versiones por SKU 25–200+
Copias en cadena 3–5
Pérdidas por datos 15–25%
Lo que el mercado demanda
  • Capa neutral de transformación de datos
  • Diccionarios y unidades de atributos unificados
  • Automatización de actualizaciones y control de calidad
Conclusión

Qué revelan estas cifras

1) El contenido es logística, pero sin industria

En el e-commerce, el dinero y la logística están industrializados desde hace tiempo. Sin embargo, los datos de los productos todavía se mueven manualmente, de forma fragmentada y con pérdidas, en docenas de versiones y formatos.

2) El problema es sistémico y, por lo tanto, no se resuelve «dentro de una sola empresa»

Cada actor se ve obligado a construir su propia capa de transformación de datos: mapeo de atributos, normalización, control de calidad, localización, feeds. Pero esto no escala a nivel de mercado: el trabajo se duplica simultáneamente en miles de empresas.

3) La brecha entre grandes y pequeños se amplía

Los grandes actores pueden imponer formatos a los proveedores e invertir en infraestructura. Los pequeños a menudo se ven obligados a publicar 'tal cual', reducir el surtido y perder eficiencia debido a la incapacidad de procesar el flujo de contenido.

Por qué surgió NotPIM Vemos este problema como una cuestión de infraestructura: el mercado necesita una capa neutral que reduzca la duplicación, minimice la pérdida de datos y automatice la logística de contenido sin intentar 'doblegar el mercado a su voluntad'. No 'otro escaparate', ni 'otro formato', sino una forma de conectar a los participantes del mercado a nivel de datos.
Declaración clave
El mercado necesita infraestructura de datos, al igual que necesita infraestructura logística.

Por eso las soluciones 'individuales' no ofrecen economías de escala, pero el enfoque a nivel de ecosistema sí lo hace.

Transparencia

Todos los valores en la página son estimaciones de órdenes de magnitud y rangos típicos del mercado internacional. Pueden variar según el país y la categoría, pero la mecánica general del mercado (duplicación, pérdidas, trabajo manual) sigue siendo la misma.

Los datos y las valoraciones de esta página son actuales a fecha de diciembre de 2025.