FAU, Facial Expressions, Valence and Arousal: A Multi-task Solution

Auteurs : Didan Deng, Zhaokang Chen, Bertram E. Shi

A technical report to the FG-2020 ABAW Competition

Résumé : In the paper, we aim to train a unified model that performs three tasks: Facial Action Units (FAU) prediction, seven basic facial expressions prediction, as well as valence and arousal prediction. The main challenge of this task is the lack of fully-annotated dataset. Most of existing datasets only contain one or two types of labels. To tackle this challenge, we propose an algorithm for the multitask model to learn from partial labels. The algorithm has two steps: first, we train a teacher model to perform all three tasks, where each instance is trained by the ground truth label of its corresponding task. Second, we refer to the outputs of the teacher model as the soft labels. We use the soft labels and the ground truths to train the student model. We find that the student model outperforms the teacher model on all the tasks, possibly due to the exposure to the full set of labels. Finally, we use ensemble modeling to boost the performance further on the three tasks.

Soumis à arXiv le 10 Fév. 2020

Explorez l'arbre d'article

Cliquez sur les nœuds de l'arborescence pour être redirigé vers un article donné et accéder à leurs résumés et assistant virtuel

Accédez également à nos Résumés, ou posez des questions sur cet article à notre Assistant IA.

Recherchez des articles similaires (en version bêta)

En cliquant sur le bouton ci-dessus, notre algorithme analysera tous les articles de notre base de données pour trouver le plus proche en fonction du contenu des articles complets et pas seulement des métadonnées. Veuillez noter que cela ne fonctionne que pour les articles pour lesquels nous avons généré des résumés et que vous pouvez le réexécuter de temps en temps pour obtenir un résultat plus précis pendant que notre base de données s'agrandit.