Objectifs pédagogiques
- Comprendre les possibilités actuelles du text-to-speech IA (TTS)
- Tester différents moteurs vocaux et ajuster les paramètres (ton, vitesse, langue, style)
- Nettoyer et améliorer un enregistrement audio avec l’IA (voix humaine ou IA)
- Restaurer un fichier audio bruité ou de mauvaise qualité
- Choisir le bon outil selon son usage (vidéo, podcast, audio guide, e-learning…)
Programme de formation
DESCRIPTION
Ce module intensif vous guide dans l’utilisation des outils d’IA dédiés à la voix et à la qualité sonore. Il explore les technologies de text-to-speech, la création de voix synthétiques personnalisées, l’amélioration audio (suppression de bruit, nettoyage vocal, rééquilibrage). Vous apprendrez à produire rapidement des voix off professionnelles ou à sublimer vos prises de son, avec une orientation pratique pour les formats médias, vidéos ou podcasts.
INTRODUCTION
Grâce à l’IA, produire un contenu audio clair, fluide et professionnel ne nécessite plus un studio ou un comédien. De la synthèse vocale au nettoyage de l’audio en passant par la duplication de voix, les outils IA ouvrent de nouvelles perspectives pour les créateurs de contenu, podcasteurs, communicants ou vidéastes. Ce module vous initie aux usages clés de l’IA dans la production et la post-production audio.
PROGRAMME
Introduction – L’IA dans la chaîne de post-production visuelle
- Qu’est-ce qu’une voix IA ? Synthèse vocale vs. clonage de voix
- Usages professionnels : podcast, vidéo, doublage, motion design, audio guides, etc.
- Présentation des outils testés pendant la session : ElevenLabs, Adobe Podcast Speech, Descript, Whisper, etc.
Module 1 – Générer une voix off à partir d’un script
Objectifs : produire une voix réaliste à partir d’un texte, ajustée au ton souhaité
- Outils TTS : ElevenLabs
- Paramétrer sa voix : langue, rythme, émotion, naturel
- Cas d’usage : narration, publicité, tuto vidéo, podcast fiction
- Introduction aux voix personnalisées et au clonage vocal
Atelier :
Générer une voix off à partir d’un script
Créer deux versions : voix neutre + voix expressive (ex : storytelling, pitch, tuto)
Module 2 – Créer un fond musical avec l’IA
Objectifs : composer une ambiance sonore cohérente, libre de droits et originale
- Présentation de Suno AI : fonctionnement, prompt, genres disponibles
- Astuces pour écrire un bon prompt musical : ambiance, instruments, tempo, style
- Utilisation dans des cas concrets : intro de podcast, fond de vidéo, habillage de storytelling
- Points de vigilance : cohérence audio / voix, durée, loops
Exercices :
- Créer une musique originale à l’aide de Suno à partir d’un brief narratif
- Combiner la voix générée (ou nettoyée) + le fond musical pour créer un extrait complet
Module 3 – Nettoyage, amélioration et restauration audio
Objectifs : sublimer un enregistrement, récupérer une prise de mauvaise qualité
- Nettoyage automatique de piste vocale : suppression des souffles, bruits de fond, clics
- Amélioration IA de la clarté et de l’intelligibilité (Adobe Enhance Speech, Krisp, Capcut)
- Cas de voix enregistrées en condition amateur : comment la rendre pro ?
- Limites des outils et précautions à prendre (filtres trop agressifs, perte de naturel…)
Exercices :
- Améliorer un fichier audio brut enregistré sur smartphone
- Comparer différentes versions traitées par différents outils IA
Conclusion et mise en perspective
- Comparatif des outils testés : forces, limites, coûts
- Cas d’application selon les métiers : journaliste, podcasteur, formateur, créateur de contenu
- Éthique et droit à la voix : ce qu’il faut savoir avant de diffuser une voix IA
- Évaluation et feedback de la session
- Feuille de route : intégrer un usage audio IA dans ses projets (prochaines étapes)
Informations pratiques
Durée de la formation
0,5 jour - 3h30
Formateur(s)
Pas de formateur
Public concerné
Créatifs d’agence ou indépendants - Responsables de production - Créatifs audio-visuels
Pré-requis
Connaissance de base des principes de base du traitement du son (prise de son et montage)
Lieu
Présentiel - Classe à distance / Capacité minimum : 6 - Capacité maximum : 12
Méthode(s) mobilisée(s)
- Démonstrations guidées sur chaque outil
- Ateliers de création : voix + musique + mixage simple
- Écoute collective et analyse des rendus
- Conseils personnalisés selon les usages des participants
Outils
- Démonstrations en direct sur les outils vocaux
- Ateliers pratiques guidés avec scripts fournis ou contenus participants
- Écoute critique des résultats et amélioration collaborative
- Accompagnement à l’appropriation des outils selon les usages
Tarif & Financement
- Inter-entreprise à partir de 490€ HT par session et par personne (finançable via OPCO)
- Intra-entreprise 2200€ HT par groupe
-10% pour les agences membres de l’UCC Grand Sud
-5% pour les membres d’AzurProCom’
-5% pour les membres du Club de la Com
Formation délivrée par Oreegami