Recomendaciones de productos con IA que realmente convierten: más allá del filtrado colaborativo
Un minorista de moda reemplazó su motor de recomendaciones basado en filtrado colaborativo con un modelo de aprendizaje profundo que incorporaba contexto de navegación, similitud visual y comportamiento de sesión en tiempo real. Las tasas de clics en las recomendaciones de productos pasaron del 2,8% al 7,1%, y la tasa de conversión en productos recomendados saltó del 1,2% al 3,4%. Los ingresos atribuidos a las recomendaciones crecieron del 11% al 24% de las ventas totales en línea.
El filtrado colaborativo, el enfoque que impulsa la mayoría de los motores de recomendación en ecommerce con la lógica de "los clientes que compraron X también compraron Y", ha sido el estándar durante más de dos décadas. Funciona razonablemente bien para catálogos grandes con datos de compra densos (Amazon construyó su sistema de recomendaciones inicial con este enfoque). Pero para la mayoría de los minoristas de mercado medio, tiene limitaciones significativas que los enfoques más nuevos resuelven.
Dónde falla el filtrado colaborativo
El problema del arranque en frío es la limitación más evidente. El filtrado colaborativo necesita historial de compras para hacer recomendaciones. Para productos nuevos con cero compras, el sistema no tiene con qué trabajar. Para clientes nuevos sin historial de compras, solo puede ofrecer listas genéricas de los más vendidos. En ecommerce, donde se lanzan productos nuevos semanalmente y los visitantes nuevos representan entre el 40% y el 60% del tráfico, esta brecha es sustancial.
El filtrado colaborativo también tiene problemas con el sesgo de popularidad. Tiende a recomendar productos populares porque esos productos aparecen en más historiales de compra. Esto crea un bucle de retroalimentación: los productos populares se recomiendan más, lo que genera más compras, lo que hace que aparezcan en aún más recomendaciones. Los productos de cola larga que podrían ser perfectos para un cliente específico rara vez salen a la superficie porque carecen de suficientes datos de compra conjunta.
El problema de la dispersión agrava ambas cuestiones. Incluso en un sitio con miles de productos y cientos de miles de clientes, la matriz de compras es extremadamente dispersa. La mayoría de los clientes han comprado una fracción mínima del catálogo, por lo que la superposición entre dos clientes cualesquiera es mínima. Esto dificulta encontrar patrones de compra conjunta fiables para cualquier cosa que no sean los artículos más populares.
Finalmente, el filtrado colaborativo ignora el contexto. No considera lo que el cliente está haciendo en este momento en su sesión. Un cliente que ha estado navegando zapatillas de running durante 20 minutos debería ver recomendaciones diferentes que el mismo cliente navegando zapatos de vestir, aunque su historial de compras sea idéntico. El filtrado colaborativo solo ve el historial de compras estático, no el comportamiento dinámico de la sesión.
El enfoque moderno: modelos híbridos de aprendizaje profundo
Los sistemas de recomendación de última generación actuales combinan múltiples tipos de señales a través de una arquitectura de aprendizaje profundo. Las entradas típicamente incluyen secuencias de interacción (no solo compras, sino también visualizaciones, añadidos al carrito, consultas de búsqueda y tiempo dedicado a las páginas de producto), embeddings de producto que capturan atributos del artículo (categoría, marca, precio, características visuales extraídas de imágenes de producto, características de texto de las descripciones), embeddings de usuario que capturan atributos del cliente y patrones de comportamiento, y señales contextuales como la hora del día, tipo de dispositivo, fuente de tráfico y actividad de la sesión actual.
El modelo aprende a predecir la probabilidad de que un cliente determinado interactúe con un producto dado, considerando todas estas entradas. Durante la inferencia (al generar recomendaciones para una sesión en vivo), el modelo puntúa todos los productos candidatos y muestra los N principales por probabilidad de interacción predicha.
La similitud visual es una de las adiciones más impactantes para las categorías de moda, decoración del hogar y estilo de vida. Una red neuronal convolucional extrae características visuales de las imágenes de producto, y estas características se utilizan para identificar productos que se parecen en estilo, color o estética. Cuando un cliente está navegando una mesa de café de nogal de estilo mid-century modern, el modelo de similitud visual puede recomendar otras piezas de mobiliario mid-century modern incluso si los datos de compra no las conectan (porque pocos clientes compran varias mesas de café).
Personalización de sesión en tiempo real
La mayor ganancia de rendimiento proviene de incorporar el comportamiento de sesión en tiempo real. Un modelo de secuencias (basado en transformers o redes neuronales recurrentes) procesa la sesión actual del cliente como un flujo de eventos: visualizaciones de páginas, consultas de búsqueda, navegación por categorías, selección de filtros y tiempo de permanencia en cada producto. Esta secuencia de sesión se codifica en un embedding de sesión que captura la intención actual del cliente.
El embedding de sesión se actualiza con cada acción que realiza el cliente. Después de ver tres vestidos azules en el rango de $50-80, el modelo de sesión aprende que el cliente está interesado en vestidos azules en ese rango de precio, y las recomendaciones se ajustan en consecuencia. Esto ocurre dentro de la sesión actual, sin esperar los datos de compra que el filtrado colaborativo requeriría.
Un minorista de belleza que implementó recomendaciones basadas en sesión observó que la relevancia de las recomendaciones (medida por la tasa de clics) aumentaba progresivamente durante una sesión. Después de 1 vista de página, las recomendaciones funcionaban de manera similar al antiguo sistema de filtrado colaborativo. Después de 5 vistas de página, las tasas de clics eran 2,1 veces más altas. Después de 10 vistas de página, eran 3,4 veces más altas. Cuanto más aprendía el modelo sobre la sesión actual, mejores eran sus recomendaciones.
Resolviendo el arranque en frío
Para productos nuevos, el modelo híbrido utiliza características basadas en contenido (atributos del producto, imágenes, descripciones) para generar recomendaciones iniciales sin ningún dato de compra. Un vestido nuevo puede recomendarse a clientes que han mostrado interés en vestidos similares por estilo, color, precio y marca, aunque nadie lo haya comprado todavía. A medida que se acumulan datos de compra, el modelo combina señales colaborativas con señales de contenido, desplazando gradualmente el peso a medida que los datos maduran.
Para visitantes nuevos sin historial, el modelo de sesión en tiempo real se activa después de solo unas pocas interacciones. Incluso sin saber quién es el cliente, el modelo adapta las recomendaciones basándose en lo que están haciendo en ese momento. La primera página de producto que visitan proporciona una señal débil. La segunda y la tercera proporcionan señales mucho más fuertes. Para cuando han navegado cinco o seis productos, las recomendaciones están significativamente personalizadas incluso para un visitante completamente anónimo.
Midiendo la calidad de las recomendaciones
La tasa de clics en las recomendaciones es la métrica más comúnmente rastreada, pero puede ser engañosa. Una recomendación que genera clics pero no conversiones está dirigiendo tráfico a páginas que no convierten, lo cual es un desperdicio de espacio valioso. Las métricas que importan son los ingresos por impresión de recomendación (ingresos totales de productos recomendados divididos por el total de impresiones de recomendación mostradas), la tasa de conversión en productos recomendados frente a la tasa de conversión general del sitio, la diversidad de productos recomendados (¿estás mostrando los mismos bestsellers a todos o realmente personalizando?) y la cobertura del catálogo (¿qué porcentaje de tu catálogo aparece en las recomendaciones durante un período de 30 días?).
Las pruebas A/B de algoritmos de recomendación son esenciales porque las métricas offline (precisión, recall, nDCG) no siempre se correlacionan con los resultados de negocio. Un modelo que es ligeramente menos preciso en predecir clics pero muestra productos más diversos podría generar más ingresos incrementales porque ayuda a los clientes a descubrir productos que no habrían encontrado de otra manera.
Para los minoristas de ecommerce que aún utilizan filtrado colaborativo básico o recomendaciones basadas en reglas, la brecha de rendimiento en comparación con los enfoques modernos de aprendizaje profundo se está ampliando. La infraestructura para desplegar estos modelos ha madurado significativamente en los últimos dos años, con plataformas como Algolia Recommend, Amazon Personalize y Dynamic Yield que ofrecen servicios de recomendación gestionados que manejan la complejidad del entrenamiento y servicio del modelo. La inversión se mide en meses de configuración, no en años, y el impacto en los ingresos es medible dentro del primer trimestre de implementación.