Language Modelling for Source Code with Transformer-XL

Mots clés générés par l'IA : Naturalness statistical language models neural language models source code modeling Transformer-XL

Points clés générés par l'IA

  • Les logiciels et les textes en langage naturel présentent une "naturalité" capturable par des modèles de langage statistiques.
  • Les modèles de langage neuronaux, notamment Transformer-XL, représentent cette naturalité grâce à l'apprentissage profond.
  • Le modèle Transformer-XL surpasse les modèles basés sur RNN dans la capture de la naturalité du logiciel avec moins de coûts computationnels.
  • Le modèle Transformer-XL nécessite un temps d'entraînement plus court et est plus efficace que les modèles RNN (y compris LSTM et GRU).
  • En pré-entraînant les modèles pour la modélisation du langage, ils peuvent apprendre le comportement statistique sous-jacent du code source pour des tâches ultérieures.
  • Les travaux futurs pourraient se concentrer sur l'application de ces modèles à des tâches telles que l'autocomplétion automatique du code ou la détection automatique d'erreurs.
  • Les modèles basés sur Transformer peuvent être réentrainés facilement pour des tâches plus complexes en exploitant la naturalité du logiciel qu'ils ont apprise.
  • J'espère que cela vous sera utile!
Accédez également à nos autres résultats générés par IA : Résumé complet, Résumé vulgarisé, Article de type blog; ou posez des questions sur cet article à notre Assistant IA.

Auteurs : Thomas Dowdell, Hongyu Zhang

Licence : CC BY 4.0

Résumé : It has been found that software, like natural language texts, exhibits "naturalness", which can be captured by statistical language models. In recent years, neural language models have been proposed to represent the naturalness of software through deep learning. In this paper, we conduct an experimental evaluation of state-of-the-art neural language models for source code, including RNN-based models and Transformer-XL based models. Through experiments on a large-scale Python code corpus, we find that the Transformer-XL model outperforms RNN-based models (including LSTM and GRU models) in capturing the naturalness of software, with far less computational cost.

Soumis à arXiv le 31 Jul. 2020

Posez des questions sur cet article à notre assistant IA

Vous pouvez aussi discutez avec plusieurs papiers à la fois ici.

Instructions pour utiliser l'assistant IA ?

Résultats du processus de synthèse de l'article arXiv : 2007.15813v1

Il a été découvert que les logiciels et les textes en langage naturel présentent une "naturalité" qui peut être capturée par des modèles de langage statistiques. Ces dernières années, des modèles de langage neuronaux ont été proposés pour représenter cette naturalité grâce à l'apprentissage profond. Dans cet article, nous menons une évaluation expérimentale des modèles de langage neuronaux de pointe pour le code source. Nous comparons notamment les modèles basés sur RNN et ceux basés sur Transformer-XL. À travers des expériences sur un corpus de code Python à grande échelle, nous constatons que le modèle Transformer-XL surpasse les modèles basés sur RNN (y compris les modèles LSTM et GRU) dans la capture de la naturalité du logiciel, avec moins de coûts computationnels. De plus, le modèle Transformer-XL nécessite un temps d'entraînement plus court par rapport aux modèles RNN. Même avec une profondeur deux fois supérieure aux RNNs, le modèle Transformer-XL à 8 couches prend moins de la moitié du temps pour s'entraîner. Cela souligne l'efficacité et la rapidité d'apprentissage des modèles basés sur Transformer-XL pour la modélisation du code source. De plus, en pré-entraînant les modèles pour effectuer la modélisation du langage, ils peuvent "apprendre" le comportement statistique sous-jacent (la naturalité) du code source. Cette compréhension peut ensuite être exploitée pour effectuer efficacement des tâches ultérieures. Les travaux futurs pourraient se concentrer sur l'application de ces modèles de langage à des tâches telles que l'autocomplétion automatique du code. De plus, ces modèles pourraient être réentrainés facilement pour effectuer des tâches plus complexes telles que la détection automatique d'erreurs ou la correction automatique de bugs. Bien que ces tâches ne puissent pas être exprimées exactement comme la modélisation du langage, la naturalité du logiciel que le modèle apprend peut être exploitée pour mieux accomplir ces tâches ultérieures. En conclusion, cet article a démontré que les modèles de langage basés sur Transformer surpassent largement les modèles basés sur RNN pour la modulation du code source. Le modèle Transformer-XL obtient des résultats nettement meilleurs avec moins de complexité et un temps d'entraînement réduit par rapport aux autres approches traditionnelles comme LSTM et GRU.
Créé le 30 Jul. 2025

Évaluez la qualité du contenu généré par l'IA en votant

Note : 0

Pourquoi avons-nous besoin de votes ?

Les votes sont utilisés pour déterminer si nous devons réexécuter nos outils de synthèse. Si le compte atteint -10, nos outils peuvent être redémarrés.

Articles similaires résumés avec nos outils d'IA

Naviguez à travers encore plus d'articles similaires en utilisant une

représentation arborescente

Recherchez des articles similaires (en version bêta)

En cliquant sur le bouton ci-dessus, notre algorithme analysera tous les articles de notre base de données pour trouver le plus proche en fonction du contenu des articles complets et pas seulement des métadonnées. Veuillez noter que cela ne fonctionne que pour les articles pour lesquels nous avons généré des résumés et que vous pouvez le réexécuter de temps en temps pour obtenir un résultat plus précis pendant que notre base de données s'agrandit.

Avertissement : Notre outil de synthèse basé sur l'IA et l'assistant virtuel fournis sur ce site Web peuvent ne pas toujours fournir des résumés complets ou des réponses exactes. Nous vous encourageons à examiner attentivement et à évaluer le contenu généré pour vous assurer de sa qualité et de sa pertinence par rapport à vos besoins.