VideoLAN, l'organisation à but non lucratif derrière VLC Media Player, a annoncé lors d'une présentation au CES 2025 que le populaire outil multimédia open source avait atteint le cap des 6 milliards de téléchargements. Bien que cette réalisation soit assez significative, ce chiffre peut être conservateur, dans la mesure où la société a probablement exclu les chiffres de téléchargement provenant de sources tierces. Parallèlement à cela, les développeurs de VideoLAN ont annoncé leurs projets futurs avec la présentation de leur prochaine grande fonctionnalité : des sous-titres basés sur l'IA et une traduction en temps réel pour 100 langues. La fonctionnalité est actuellement en cours de développement et est conçue pour créer des sous-titres en temps réel à l'aide de modèles d'intelligence artificielle (IA) open source.
Il est intéressant de noter que la prochaine fonctionnalité de sous-titres basée sur l'IA de VLC semble s'inspirer d'avancées telles que Whisper d'OpenAI, un système de reconnaissance vocale automatique (ASR) conçu pour transcrire l'audio en texte. Whisper a été félicité pour sa capacité à gérer divers accents et dialectes en utilisant des ensembles de données à grande échelle pour la formation.
Génération et traduction automatiques de sous-titres VLC basées sur des modèles d'IA locaux et open source fonctionnant sur votre machine fonctionnant hors ligne et prenant en charge de nombreuses langues ! La démo peut être trouvée sur notre stand #CES2025 à Eureka Park. pic.twitter.com/UVmgT6K4ds8 janvier 2025
Cependant, VLC adopte une approche différente dans laquelle les modèles d'IA fonctionneront hors ligne directement dans l'application VLC. Cette fonctionnalité est particulièrement remarquable car elle élimine le besoin d’une connexion Internet ou le recours à des services basés sur le cloud, qui constituent souvent une préoccupation pour les utilisateurs soucieux de leur confidentialité.
À propos de cette nouvelle fonctionnalité, Jean-Baptiste Kempf, président de VideoLAN, a déclaré : « En même temps, nous disposons d'une traduction automatique qui permet de traduire les sous-titres dans votre propre langue. Ce qui est important, c'est que cela s'exécute sur votre machine localement, hors ligne, sans aucun service cloud. Il s’exécute directement dans l’exécutable.
Le sous-titrage AI est également capable de gérer différents formats multimédias, ce qui en fait un outil essentiel pour les utilisateurs cherchant à profiter de contenus dans différentes langues sans logiciel externe. Selon l'entreprise, l'IA sera capable de générer des sous-titres et des traductions de vidéos dans plus de 100 langues, rendant VLC plus accessible à un public mondial.
VideoLAN n'a pas encore confirmé de date de sortie officielle pour la nouvelle fonctionnalité, même si elle devrait être lancée sous forme de mise à jour gratuite dans un avenir proche. De plus amples détails seront partagés via le blog de l'entreprise.
Bien que l'ajout de sous-titres et de traductions basés sur l'IA constitue un grand pas en avant pour VLC, des questions demeurent quant à la manière dont les développeurs vont résoudre les problèmes courants liés aux sous-titres inexacts générés par l'IA, qui peuvent avoir un impact négatif sur l'expérience utilisateur. Comme l'a souligné PC Mag, il existe une curiosité quant aux modèles d'IA open source que le lecteur multimédia utilisera et si la configuration système requise pour la fonctionnalité pourrait entraîner une consommation importante de ressources. Il y a de fortes chances que vous ayez besoin d'un PC doté d'un NPU (Neural Processing Unit) dédié.