Enhancing Embedding Representation Stability in Recommendation Systems with Semantic ID

Mots clés générés par l'IA : Content online ID-based models industrial recommendation systems Semantic ID prefix ngram attention-based models

Points clés générés par l'IA

La licence de l'article ne nous permet pas de nous appuyer sur son contenu et les points clés sont générés à l'aide des métadonnées de l'article plutôt que de l'article complet.

  • Le développement exponentiel du contenu en ligne a posé des défis aux modèles basés sur les ID dans les systèmes de recommandation industriels.
  • Les défis incluent la cardinalité élevée, l'espace ID en croissance dynamique, les distributions d'engagement biaisées et l'instabilité des prédictions dues aux cycles de vie naturels des IDs.
  • De nombreux systèmes utilisent le hachage aléatoire pour gérer l'espace ID et contrôler les paramètres du modèle correspondants.
  • Cependant, cette approche introduit une pollution des données provenant de plusieurs IDs partageant le même embedding, entraînant une dégradation des performances du modèle et une instabilité de la représentation de l'embedding.
  • Une nouvelle technique de paramétrisation des tokens est présentée pour améliorer significativement les performances du modèle en regroupant hiérarchiquement les éléments en fonction de leurs embeddings de contenu.
  • Cette technique permet d'adresser l'instabilité des embeddings, d'améliorer la modélisation des IDs marginaux, réduire le surajustement et atténuer les changements dans la représentation.
  • L'intégration de cette technique dans le système Meta production Ads Ranking a entraîné des gains notables en performance et une meilleure stabilité des prédictions lors des déploiements en direct.
Accédez également à nos autres résultats générés par IA : Résumé complet, Résumé vulgarisé, Article de type blog; ou posez des questions sur cet article à notre Assistant IA.

Auteurs : Carolina Zheng, Minhui Huang, Dmitrii Pedchenko, Kaushik Rangadurai, Siyu Wang, Gaby Nahum, Jie Lei, Yang Yang, Tao Liu, Zutian Luo, Xiaohan Wei, Dinesh Ramasamy, Jiyan Yang, Yiping Han, Lin Yang, Hangjun Xu, Rong Jin, Shuang Yang

Résumé : The exponential growth of online content has posed significant challenges to ID-based models in industrial recommendation systems, ranging from extremely high cardinality and dynamically growing ID space, to highly skewed engagement distributions, to prediction instability as a result of natural id life cycles (e.g, the birth of new IDs and retirement of old IDs). To address these issues, many systems rely on random hashing to handle the id space and control the corresponding model parameters (i.e embedding table). However, this approach introduces data pollution from multiple ids sharing the same embedding, leading to degraded model performance and embedding representation instability. This paper examines these challenges and introduces Semantic ID prefix ngram, a novel token parameterization technique that significantly improves the performance of the original Semantic ID. Semantic ID prefix ngram creates semantically meaningful collisions by hierarchically clustering items based on their content embeddings, as opposed to random assignments. Through extensive experimentation, we demonstrate that Semantic ID prefix ngram not only addresses embedding instability but also significantly improves tail id modeling, reduces overfitting, and mitigates representation shifts. We further highlight the advantages of Semantic ID prefix ngram in attention-based models that contextualize user histories, showing substantial performance improvements. We also report our experience of integrating Semantic ID into Meta production Ads Ranking system, leading to notable performance gains and enhanced prediction stability in live deployments.

Soumis à arXiv le 02 Avr. 2025

Posez des questions sur cet article à notre assistant IA

Vous pouvez aussi discutez avec plusieurs papiers à la fois ici.

La licence de l'article ne nous permet pas de nous appuyer sur son contenu et l'assistant IA ne peut se servir que des métadonnées de l'article plutôt que de l'article complet.

Instructions pour utiliser l'assistant IA ?

Résultats du processus de synthèse de l'article arXiv : 2504.02137v1

La licence de cet article ne nous permet pas de nous appuyer sur son contenu et le processus de synthèse est ici effectué avec les métadonnées de l'article plutôt qu'avec l'article en tant que tel.

Le développement exponentiel du contenu en ligne a posé d'importants défis aux modèles basés sur les ID dans les systèmes de recommandation industriels. Ces défis incluent la cardinalité extrêmement élevée et l'espace ID en croissance dynamique, ainsi que des distributions d'engagement très biaisées et l'instabilité des prédictions due aux cycles de vie naturels des IDs (par exemple, la naissance de nouveaux IDs et la retraite des anciens IDs). Pour résoudre ces problèmes, de nombreux systèmes s'appuient sur le hachage aléatoire pour gérer l'espace ID et contrôler les paramètres du modèle correspondants (c'est-à-dire la table d'embedding). Cependant, cette approche introduit une pollution des données provenant de plusieurs IDs partageant le même embedding, ce qui entraîne une dégradation des performances du modèle et une instabilité de la représentation de l'embedding. Ce document examine ces défis et présente , une nouvelle technique de paramétrisation des tokens qui améliore significativement les performances du . crée des collisions sémantiquement significatives en regroupant hiérarchiquement les éléments en fonction de leurs embeddings de contenu, par opposition à des affectations aléatoires. À travers une expérimentation approfondie, nous démontrons que permet non seulement d'adresser l'instabilité des embeddings mais aussi d'améliorer considérablement la modélisation des IDs marginaux, réduit le surajustement et atténue les changements dans la représentation. Nous mettons également en avant les avantages du dans les modèles basés sur l'attention qui contextualisent les historiques utilisateurs, montrant ainsi d'importantes améliorations des performances. Nous rapportons également notre expérience d'intégration du dans le système Meta production Ads Ranking, entraînant ainsi des gains notables en performance et une meilleure stabilité des prédictions lors des déploiements en direct. Les auteurs impliqués dans cette recherche sont Carolina Zheng, Minhui Huang, Dmitrii Pedchenko, Kaushik Rangadurai, Siyu Wang, Gaby Nahum, Jie Lei,Yang Yang,Tao Liu,Zutian Luo,Xiaohan Wei,Dinesh Ramasamy,Jiyan Yang,Yiping Han,Lin Yang,Hangjun Xu,Rong Jin et Shuang Yang.
Créé le 23 Oct. 2025

Évaluez la qualité du contenu généré par l'IA en votant

Note : 0

Pourquoi avons-nous besoin de votes ?

Les votes sont utilisés pour déterminer si nous devons réexécuter nos outils de synthèse. Si le compte atteint -10, nos outils peuvent être redémarrés.

Articles similaires résumés avec nos outils d'IA

Naviguez à travers encore plus d'articles similaires en utilisant une

représentation arborescente

Recherchez des articles similaires (en version bêta)

En cliquant sur le bouton ci-dessus, notre algorithme analysera tous les articles de notre base de données pour trouver le plus proche en fonction du contenu des articles complets et pas seulement des métadonnées. Veuillez noter que cela ne fonctionne que pour les articles pour lesquels nous avons généré des résumés et que vous pouvez le réexécuter de temps en temps pour obtenir un résultat plus précis pendant que notre base de données s'agrandit.

Avertissement : Notre outil de synthèse basé sur l'IA et l'assistant virtuel fournis sur ce site Web peuvent ne pas toujours fournir des résumés complets ou des réponses exactes. Nous vous encourageons à examiner attentivement et à évaluer le contenu généré pour vous assurer de sa qualité et de sa pertinence par rapport à vos besoins.