Rekomendasi Produk Berbasis AI yang Benar-Benar Mengkonversi: Melampaui Collaborative Filtering
Sebuah retailer fashion mengganti mesin rekomendasi collaborative filtering mereka dengan model deep learning yang menggabungkan konteks penelusuran, kesamaan visual, dan perilaku sesi secara real-time. Click-through rate pada rekomendasi produk meningkat dari 2,8% menjadi 7,1%, dan tingkat konversi pada produk yang direkomendasikan melonjak dari 1,2% menjadi 3,4%. Pendapatan yang dikaitkan dengan rekomendasi tumbuh dari 11% menjadi 24% dari total penjualan online.
Collaborative filtering, pendekatan yang menggerakkan sebagian besar mesin rekomendasi ecommerce dengan logika "pelanggan yang membeli X juga membeli Y," telah menjadi standar selama lebih dari dua dekade. Pendekatan ini cukup efektif untuk katalog besar dengan data pembelian yang padat (Amazon membangun sistem rekomendasi awal mereka dengan metode ini). Namun bagi sebagian besar retailer menengah, metode ini memiliki keterbatasan signifikan yang dapat diatasi oleh pendekatan-pendekatan baru.
Di Mana Collaborative Filtering Kurang Optimal
Masalah cold start adalah keterbatasan yang paling jelas. Collaborative filtering membutuhkan riwayat pembelian untuk membuat rekomendasi. Untuk produk baru tanpa pembelian sama sekali, sistem tidak memiliki data untuk diproses. Untuk pelanggan baru tanpa riwayat pembelian, sistem hanya bisa menawarkan daftar produk terlaris secara umum. Dalam ecommerce, di mana produk baru diluncurkan setiap minggu dan pengunjung baru mewakili 40-60% dari traffic, kesenjangan ini sangat substansial.
Collaborative filtering juga mengalami masalah bias popularitas. Metode ini cenderung merekomendasikan produk populer karena produk tersebut muncul di lebih banyak riwayat pembelian. Hal ini menciptakan feedback loop: produk populer lebih sering direkomendasikan, yang mendorong lebih banyak pembelian, yang membuat produk tersebut muncul di lebih banyak rekomendasi lagi. Produk long-tail yang mungkin sempurna untuk pelanggan tertentu jarang muncul karena kurangnya data co-purchase yang memadai.
Masalah sparsity memperparah kedua isu tersebut. Bahkan di situs dengan ribuan produk dan ratusan ribu pelanggan, matriks pembelian sangat jarang terisi. Sebagian besar pelanggan hanya membeli sebagian kecil dari katalog, sehingga tumpang tindih antara dua pelanggan mana pun sangat minimal. Hal ini membuat sulit untuk menemukan pola co-purchase yang andal untuk apa pun selain produk-produk paling populer.
Terakhir, collaborative filtering mengabaikan konteks. Metode ini tidak mempertimbangkan apa yang sedang dilakukan pelanggan saat ini dalam sesi mereka. Pelanggan yang telah menelusuri sepatu lari selama 20 menit seharusnya melihat rekomendasi yang berbeda dari pelanggan yang sama saat menelusuri sepatu formal, meskipun riwayat pembelian mereka identik. Collaborative filtering hanya melihat riwayat pembelian statis, bukan perilaku sesi yang dinamis.
Pendekatan Modern: Model Deep Learning Hybrid
Sistem rekomendasi state-of-the-art saat ini menggabungkan berbagai jenis sinyal melalui arsitektur deep learning. Input biasanya mencakup urutan interaksi (bukan hanya pembelian tetapi juga tampilan halaman, add-to-cart, kueri pencarian, dan waktu yang dihabiskan di halaman produk), embedding produk yang menangkap atribut item (kategori, merek, harga, fitur visual yang diekstrak dari gambar produk, fitur teks dari deskripsi), embedding pengguna yang menangkap atribut pelanggan dan pola perilaku, serta sinyal kontekstual seperti waktu dalam sehari, jenis perangkat, sumber traffic, dan aktivitas sesi saat ini.
Model ini belajar memprediksi probabilitas bahwa pelanggan tertentu akan berinteraksi dengan produk tertentu, dengan mempertimbangkan semua input tersebut. Selama inference (saat menghasilkan rekomendasi untuk sesi langsung), model memberikan skor pada semua produk kandidat dan menampilkan N teratas berdasarkan probabilitas interaksi yang diprediksi.
Kesamaan visual adalah salah satu penambahan paling berdampak untuk kategori fashion, dekorasi rumah, dan gaya hidup. Convolutional neural network mengekstrak fitur visual dari gambar produk, dan fitur-fitur ini digunakan untuk mengidentifikasi produk yang terlihat mirip dalam gaya, warna, atau estetika. Ketika pelanggan menelusuri meja kopi walnut bergaya mid-century modern, model kesamaan visual dapat merekomendasikan furnitur mid-century modern lainnya meskipun data pembelian tidak menghubungkan mereka (karena sedikit pelanggan yang membeli beberapa meja kopi sekaligus).
Personalisasi Sesi Real-Time
Peningkatan performa terbesar datang dari penggabungan perilaku sesi secara real-time. Model sekuensial (berbasis transformer atau recurrent neural network) memproses sesi pelanggan saat ini sebagai aliran peristiwa: tampilan halaman, kueri pencarian, navigasi kategori, pemilihan filter, dan waktu tinggal di setiap produk. Urutan sesi ini dikodekan menjadi session embedding yang menangkap niat pelanggan saat ini.
Session embedding diperbarui dengan setiap tindakan yang dilakukan pelanggan. Setelah melihat tiga gaun biru dalam kisaran harga $50-80, model sesi mempelajari bahwa pelanggan tertarik pada gaun biru dalam rentang harga tersebut, dan rekomendasi bergeser sesuai. Hal ini terjadi dalam sesi saat ini, tanpa menunggu data pembelian yang dibutuhkan oleh collaborative filtering.
Sebuah retailer kecantikan yang mengimplementasikan rekomendasi berbasis sesi menemukan bahwa relevansi rekomendasi (diukur dengan click-through rate) meningkat secara progresif selama sesi berlangsung. Setelah 1 tampilan halaman, rekomendasi berkinerja serupa dengan sistem collaborative filtering lama. Setelah 5 tampilan halaman, click-through rate 2,1x lebih tinggi. Setelah 10 tampilan halaman, hasilnya 3,4x lebih tinggi. Semakin banyak model mempelajari sesi saat ini, semakin baik rekomendasinya.
Mengatasi Masalah Cold Start
Untuk produk baru, model hybrid menggunakan fitur berbasis konten (atribut produk, gambar, deskripsi) untuk menghasilkan rekomendasi awal tanpa data pembelian apa pun. Gaun baru dapat direkomendasikan kepada pelanggan yang telah menunjukkan minat pada gaun serupa berdasarkan gaya, warna, harga, dan merek, meskipun belum ada yang membelinya. Seiring data pembelian terkumpul, model memadukan sinyal kolaboratif dengan sinyal konten, secara bertahap menggeser bobot seiring data semakin matang.
Untuk pengunjung baru tanpa riwayat, model sesi real-time mulai bekerja hanya setelah beberapa interaksi. Bahkan tanpa mengetahui siapa pelanggan tersebut, model menyesuaikan rekomendasi berdasarkan apa yang sedang mereka lakukan saat ini. Halaman produk pertama yang mereka kunjungi memberikan sinyal lemah. Halaman kedua dan ketiga memberikan sinyal yang jauh lebih kuat. Pada saat mereka telah menelusuri lima atau enam produk, rekomendasi sudah dipersonalisasi secara signifikan bahkan untuk pengunjung yang sepenuhnya anonim.
Mengukur Kualitas Rekomendasi
Click-through rate pada rekomendasi adalah metrik yang paling umum dilacak, tetapi bisa menyesatkan. Rekomendasi yang mendorong klik tetapi tidak menghasilkan konversi berarti menghasilkan traffic ke halaman yang tidak mengkonversi, yang merupakan pemborosan ruang berharga. Metrik yang benar-benar penting adalah pendapatan per impresi rekomendasi (total pendapatan dari produk yang direkomendasikan dibagi total impresi rekomendasi yang ditampilkan), tingkat konversi pada produk yang direkomendasikan vs. tingkat konversi situs secara keseluruhan, keragaman produk yang direkomendasikan (apakah Anda menampilkan produk terlaris yang sama kepada semua orang, atau benar-benar melakukan personalisasi?), dan cakupan katalog (berapa persentase katalog Anda yang muncul dalam rekomendasi selama periode 30 hari).
A/B testing algoritma rekomendasi sangat penting karena metrik offline (precision, recall, nDCG) tidak selalu berkorelasi dengan hasil bisnis. Model yang sedikit kurang presisi dalam memprediksi klik tetapi menampilkan produk yang lebih beragam mungkin menghasilkan lebih banyak pendapatan inkremental karena membantu pelanggan menemukan produk yang tidak akan mereka temukan sebelumnya.
Bagi retailer ecommerce yang masih menjalankan collaborative filtering dasar atau rekomendasi berbasis aturan, kesenjangan performa dibandingkan dengan pendekatan deep learning modern semakin melebar. Infrastruktur untuk menerapkan model-model ini telah matang secara signifikan dalam dua tahun terakhir, dengan platform seperti Algolia Recommend, Amazon Personalize, dan Dynamic Yield yang menawarkan layanan rekomendasi terkelola yang menangani kompleksitas pelatihan dan penyajian model. Investasinya diukur dalam hitungan bulan untuk setup, bukan tahun, dan dampak pendapatan dapat diukur dalam kuartal pertama penerapan.