Di saat para pengunjung website menjelajah internet, mereka meninggalkan banyak data perilaku, seperti halaman yang dikunjungi, apa yang di klik, dan apa yang dibagikan di media sosial. Melalui uji coba, kami membandingkan beberapa algoritme berbeda dan menemukan cara untuk mengetahui iklan apa yang memiliki kemungkinan tertinggi untuk diklik.

Pikirkan kembali saat di mana teman-teman Anda merekomendasikan sebuah film untuk akhir pekan. Apakah tips mereka berdasarkan apa yang mereka tahu Anda suka, apa yang mereka suka dan asumsi dasar bahwa semuanya memiliki selera yang sama, atau konteks dari percakapan Anda saat ini?

Sekarang ini, hampir di setiap tempat online, mulai dari toko e-commerce sampai bioskop dan platform sosial online, ada banyak sistem rekomendasi yang bekerja dengan melihat perilaku pengguna dari latar belakang dan memberi saran benda-benda yang mungkin menarik bagi mereka.

Semua perusahaan besar online berusaha untuk meningkatkan kemampuan mereka untuk memberikan rekomendasi-rekomendasi yang relevan dan dipersonalisasi untuk para pengguna. Di artikel ini, Anda dapat menengok berbagai jenis sistem rekomendasi, algoritme penyaringan, dan bagaimana cara kerja content recommendation engine MGID.

# Apa itu content recommendation engine?

Sistem pemberi rekomendasi memberikan observasi dari perilaku seorang pengguna dan memprediksi apa hal lain yang serupa yang dapat menarik perhatiannya. Intinya, sistem-sistem ini membantu membuat pengalaman yang dipersonalisasi layaknya seorang teman yang mengenal Anda, apa yang Anda suka, apa yang orang lain suka, dan paham pilihan apa saja yang ada untuk Anda.

Klik-klik, pembelian, tontonan, perilaku baca, atau tindakan lainnya dari seorang pengguna dapat direpresentasikan dengan grafik sebagai koneksi antara para pengguna di satu sisi dan konten atau benda di sisi lainnya. Setiap baris berarti bahwa seorang pengguna membeli, menonton, atau mengeklik sebuah benda tertentu. Di beberapa sistem, koneksi-koneksi ini mungkin kekuatannya bervariasi; contoh, beberapa mungkin mengidentifikasi berapa kali sebuah benda dibeli atau peringkat film dalam skala 1 sampai 10. Maka, masalahnya adalah untuk mengidentifikasi apa saja garis-garis tidak diketahui lainnya yang dapat ditambahkan di grafik ini dan memprediksi kekuatannya.

Ada dua jenis yang berbeda dari sistem-sistem rekomendasi, ada yang berdasarkan penyaringan benda atau pengguna. Algoritme penyaringan berbasis pengguna cukup polos; algoritme hanya memilih para pengguna lainnya dengan minat atau pola perilaku yang serupa, kemudian menganalisis benda-benda apa saja yang dipilih oleh para pengguna lainnya yang serupa, dan menyarankan benda-benda itu ke pengguna baru.

Berbeda dengan algoritme berbasis benda yang mencari benda-benda yang terkait di seluruh katalog. Di dalam algoritme ini, kata 'terkait' ditentukan berdasarkan per kasus. Sering kali, ini berarti bahwa benda A telah dipilih (dibeli, diklik, ditonton, dll.) dengan frekuensi yang tinggi dan tidak umum oleh para pengguna yang juga memilih benda B (benda yang terkait.

Sejarah dari recommendation engine

Pada tahun 1998, saat Amazon masih merupakan sebuah toko buku, mereka telah meluncurkan sebuah item-to-item recommendation engine yang sangat sederhana. Algoritme pertama mereka dibuat berdasarkan penyaringan kolaboratif dan menyarankan benda-benda baru untuk dibeli berdasarkan benda apa yang berada di keranjang belanja pengguna. Fitur ini diterima dengan baik oleh para pengguna, dan sejak itu sistem-sistem rekomendasi telah menjadi populer di internet.

Pada tahun 2003, Amazon dan operator e-commerce besar lainnya telah memiliki fitur canggih ini: fitur ini sekarang memasok rekomendasi berdasarkan pembelian sebelumnya dan benda-benda yang ditelusuri oleh seorang pengguna di dalam toko. Halaman-halaman hasil pencarian memiliki algoritme yang berbeda yang menampilkan benda-benda yang lebih terkait dengan pencarian. Lebih banyak lagi halaman-halaman yang memiliki setidaknya konten terekomendasi, termasuk halaman penelusuran, halaman detail produk, dan lain-lain. Pada saat itu, sekitar 30% dari semua pageview di Amazon datang dari sistem perekomendasi.

Kemudian para pemain online di bidang hiburan, perjalanan dan niche lainnya juga mulai menggunakan algoritme rekomendasi. Netflix telah menggunakan fitur ini secara ekstensif, dan pada tahun 2006 mereka mengumumkan kompetisi ML untuk masalah prediksi peringkat film, yang disebut Netflix Prize. Mereka menawarkan $1 juta untuk meningkatkan akurasi dari sistem rekomendasi film yang digunakan. Berbagai macam solusi dan algoritme dinilai berdasarkan apakah ia dapat meminimalkan root mean squared error (RMSE) dari peringkat yang diprediksi, dengan pengurangan 10% ditentukan sebagai targetnya.

Akhirnya, pada tahun 2010-an, para penerbit digital dan website berita juga mulai menggunakan rekomendasi diskoveri konten, menawarkan artikel-artikel tambahan kepada para pengunjung berdasarkan perilaku dan minat onsite mereka. Artikel-artikel yang direkomendasikan ini dapat mengarah ke konten dari situs yang sama atau ke situs lainnya, menunjukkan konten video, atau mempratinjau format web lainnya.

Rekomendasi-rekomendasi on-site dapat meningkatkan engagement pengguna dengan situs penerbit dan mengurangi bounce rate sementara rekomendasi-rekomendasi off-site digunakan untuk mempromosikan proyek-proyek konten eksternal, mengiklankan produk dan menghasilkan lead.

Saat ini, para penerbit menambahkan rekomendasi diskoveri konten dalam berbagai cara, mulai dari plugin sederhana sampai platform khusus dengan fungsionalitas yang beragam. Satu contohnya adalah platform MGID yang menjadi platform pertama untuk menawarkan widget rekomendasi konten, format paling popular saat ini.

Beberapa dari engine perekomendasi (terutama plugin) berpusat pada analisis kata kunci dan tag untuk menyarankan konten yang serupa dengan apa yang sedang dikonsumsi oleh pengguna. Engine lainnya menginvestigasi perilaku pengguna, bagaimana mereka menjadi terlibat dengan konten yang berbeda, minat mereka, dan demografis sosial untuk memberikan rekomendasi.

Penyaringan berbasis kolaboratif vs konten

Ada dua pendekatan umum untuk membangun algoritme rekomendasi, penyaringan berbasis konten dan kolaboratif.

Penyaringan berbasis konten melabelkan setiap benda atau pengguna dengan karakteristik tertentu lalu melihat ke dalam fitur-fiturnya untuk membuat asumsi tentang kemiripannya. Anda harus tahu betul tentang produk atau pemirsa untuk membuat menaksirnya. Contoh, engine perekomendasi harus tahu genre film tertentu dari berbagai film, negara asalnya, sutradara, tanggal rilis, dll. untuk menyimpulkan bahwa film-film itu serupa dan merekomendasikan satu film saat pengguna tertarik dengan film lainnya.

Berbeda dengan penyaringan konten, sistem kolaboratif tidak membutuhkan keahlian produk yang mendalam atau kategorisasi ekstensif karena sistem ini hanya melihat perilaku pengguna. Fitur atau karakteristik diambil langsung dari data historis dari interaksi lampau antara pengguna dan benda. Engine ini membangun matriks raksasa antara pengguna dan benda dan mengidentifikasi kluster umum untuk membuat saran. Matriks jauh yang sesuai juga dapat digunakan untuk factorization matriks.

Maka, sistem-sistem perekomendasi kolaboratif dapat dibedakan menjadi dua jenis:

penyaringan berbasis memori

Sistem ini mencari kemiripan item-to-item atau user-to-user. Pada dasarnya, sistem ini membuat rekomendasi berdasarkan siapa saja yang membeli (atau menonton, mengeklik, dll.) produk A juga membeli produk B. Sistem berbasis memori dapat bekerja secara jitu, namun memerlukan pengelompokan multi-dimensional dan sulit untuk diskalakan.

penyaringan berbasis model

Di sini, algoritme berpusat pada factorization matriks; Anda harus menentukan fitur dalam jumlah tertentu (parameter) dan berat dari fitur-fitur ini, misal, membangun model matematis untuk memprediksi kemiripan benda. Anda juga harus memilih fungsi objektif untuk modelnya, contoh, kemungkinan pembelian.

Ringkasnya, model-model berbasis konten dapat digunakan saat semua fitur yang terkait dengan benda pengguna telah diketahui. Di sisi lain, penyaringan kolaboratif mendistribusikan rekomendasi tanpa keahlian produk yang mendalam atau saat adanya kemungkinan tinggi atas kesimpulan yang bias. Untuk memanfaatkan keahlian produk yang ada dan menghindari kemungkinan bias, penyaringan hibrida dapat digunakan.

Content recommendation engine MGID

Algoritme MGID memilih periklanan native yang mungkin menarik bagi pengguna berdasarkan perilakunya dan konteks halaman. Fungsi objektif dari engine adalah meningkatkan CTR (click-through rate) pengunjung, misal, sistem memprediksi kemungkinan pengguna mengeklik berbagai macam periklanan dan menunjukkan iklan dengan kemungkinan tertinggi.

Algoritmenya berdasarkan penyaringan hibrida berbasis benda, misal, sistem perekomendasi mencampurkan data dari algoritme berbasis konten (menggunakan kategori konten dari halaman web dan periklanan, demografis sosial, minat pemirsa, dll.) dengan algoritme berbasis perilaku (menggunakan pageview, klik, dan impresi lampau pengguna).

Pentingnya minat jangka pendek pengguna

Saat membangun sistem perekomendasi, kami berupaya untuk membedakan fitur atau parameter yang dapat membantu kami menunjukkan iklan-iklan yang paling relevant dan click-worthy. Berdasarkan banyak eksperimen dan uji coba, kami menentukan bahwa minat jangka pendek pengguna, misal, observasi dari tindakan terbaru dari pengguna di sebuah situs seperti klik dan pageview, adalah parameter terpenting yang memprediksi iklan mana yang mungkin akan diklik.

Contoh, kemungkinan seorang pengguna mengeklik iklan dari kategori tertentu meningkat jika dia baru saja mengeklik iklan lain dari kategori yang sama. Menggunakan minat jangka pendek pengguna sebagai prediktor utama untuk memilih rekomendasi konten, kami mampu meningkatkan rata-rata CTR hingga 3,5% di dalam kampanye produk dan hingga 4,5% di dalam kampanye lainnya.

Sistem memperbarui dirinya secara langsung berdasarkan informasi baru tentang klik dan pageview pengguna. Untuk setiap penempatan iklan yang menjadi bagian dari konten halaman web dan tindakan baru dari pengguna di dalam situs, engine rekomendasi MGID mencari iklan paling relevan, menyaring duplikat atau menyingkirkan iklan, lalu iklan ditunjukkan ke pengunjung.

Jarak waktu dari tindakan yang diamati juga penting: jika pengguna telah mengeklik iklan dari kategori tertentu bahkan beberapa hari yang lalu, tidak ada cukup bukti bahwa iklan dari kategori yang sama akan berguna bagi dia. Maka, kami hanya mengidentifikasi dan menyimpan data perilaku pengguna terkini.

Penutup

Semua raksasa online sedang berjuang untuk mendapatkan sistem rekomendasi yang lebih baik. Di satu sisi, selera dan perilaku manusia tidak akan pernah dapat diprediksi secara sempurna karena ada banyak sekali variabel yang berbeda dan selalu mengalir. Namun, kita dapat memperkirakan dan menunjukkan iklan mana yang paling sesuai menggunakan banyak daya preferensi dan perilaku.

Di dalam periklanan native, recommendation engine bertindak sebagai pihak ketiga yang menyeimbangkan minat pengguna dengan pengaturan penerbit dan penargetan pengiklan. Dengan begini, rekomendasi konten dapat mendorong engagement pengguna, dan juga menghasilkan lebih banyak konversi dan penjualan.

Sekarang karena kita sudah mencakup dasar-dasar dari bagaimana cara kerja sistem rekomendasi dan bagaimana MGID melakukannya, kami mengundang Anda untuk menghubungi kami dan mencari tahu bagaimana platform MGID dapat membantu bisnis online Anda.

Oleksii Borysov

Oleksii Borysov adalah Wakil Presiden Produk di MGID dengan pengalaman lebih dari 10 tahun di AdTech. Oleksii adalah seorang ahli dan pemimpin yang telah diakui di dalam industri, dan selalu fokus dengan inovasi baru yang menakjubkan dan membawa hasil. Di MGID, perannya berpusat pada kepemimpinan inovasi, menyalurkan solusi-solusi terbukti dan mencari cara-cara baru untuk meningkatkan produk utama kami – platform periklanan global MGID. Oleksii telah membangun unit data-sains dari awal dan juga bertanggung jawab atas merekrut tim produk dan membimbing mereka dalam menerapkan fitur-fitur baru.

Bagaimana Cara Kerja Content Recommendation Engine?