Intelligence artificielle : Meta lance AudioCraft son IA générative dans le domaine de l’audio capable de créer des musiques

Artificial Intelligence Digital World Meta Tech
Getting your Trinity Audio player ready...

Meta vient de dévoiler un code d’intelligence artificielle (IA) en open source appelé AudioCraft. Il permet aux utilisateurs de créer de la musique et des sons à partir de simples requêtes écrites.

Meta n’est pas le premier géant technologique à lancer un modèle qui génère de l’audio

Quelques semaines après avoir annoncé la commercialisation de son modèle de langage Llama 2 en partenariat avec Microsoft Azure, Meta continue sa percée dans le secteur de l’IA générative.

Des modèles en open source

AudioCraft est composé de trois modèles distincts. Le premier, MusicGen, a été entraîné sur « 20 000 heures de musique appartenant à Meta ou faisant l’objet d’une licence spécifique ». Il est capable de générer de la musique à partir de textes.

Le second est baptisé AudioGen. Formé grâce à des effets sonores publics, il crée des sons à partir de prompts écrits, tels qu’un aboiement de chien ou des bruits de pas. Le dernier modèle est une version améliorée d’EnCodec, qui permet de générer de la musique de « meilleure qualité avec moins d’artefacts ».

« Si l’IA générative a suscité beaucoup d’enthousiasme pour les images, la vidéo et le texte, l’audio semble un peu à la traîne. Des travaux sont en cours, mais ils sont très compliqués et peu ouverts, ce qui empêche les gens de s’y frotter facilement », écrit l’entreprise dans un billet de blog. Elle a décidé de publier le code d’AudioCraft en open source afin que « d’autres chercheurs puissent plus facilement tester de nouvelles approches pour limiter ou éliminer les biais potentiels et l’utilisation abusive des modèles génératifs ».

Selon Meta, AudioCraft peut donner naissance à une nouvelle vague de chansons, de la même manière que les synthétiseurs ont changé la musique lorsqu’ils sont devenus populaires.

Pierre Ouédraogo