À propos de Couper les silences
L'outil Auto-Cut Silence d'AntiUpload trouve les plages de silence dans un enregistrement de podcast ou de vidéo et les supprime, laissant la parole (ou tout autre contenu non silencieux) intacte. C'est la fonction de suppression de silences de Descript / Adobe Podcast Enhance / Riverside, gratuite et s'exécutant localement dans votre navigateur via le filtre « silencedetect » de FFmpeg. Le flux en deux passes : la passe 1 analyse l'audio à la recherche de plages plus silencieuses que votre seuil (-30 dB par défaut) durant plus longtemps que votre minimum (0,5 s par défaut), et émet des paires d'horodatages silence_start / silence_end. La passe 2 les inverse en plages de parole (avec un rembourrage configurable pour que les mots ne soient pas coupés aux points de coupe), construit un graphe filter_complex qui rogne chaque plage de parole et les concatène à nouveau.
L'économie compte : Descript facture 24 $/mois pour la suite d'édition qui inclut cette fonction ; Adobe Podcast (le concurrent gratuit le plus proche) limite l'offre gratuite à 1 heure/mois avec des problèmes de qualité intermittents. Notre outil s'exécute localement, n'a pas de limite de temps et produit une sortie prévisible (vous contrôlez le seuil et le rembourrage, pas un modèle d'apprentissage automatique opaque). Le compromis : nous utilisons un détecteur de silence simple basé sur l'énergie (silencedetect de FFmpeg), pas le détecteur conscient de la parole qu'utilise Descript. Si vous avez de la musique de fond qui passe en dessous du seuil à certains endroits, notre outil la coupera ; le modèle de Descript sait « il y a encore de la musique en dessous, ne coupe pas ». Pour le contenu de voix pure (podcasts sans musique de fond, messages vocaux, enregistrements de réunions), le détecteur simple égale le comportement du détecteur intelligent sans aucun coût.
Le seuil (-30 dB par défaut) et la durée minimale de silence (0,5 s par défaut) sont les deux principales molettes. Un seuil plus bas (plus négatif, par exemple -40 dB) ne coupe que les parties vraiment silencieuses : plus sûr, conservateur. Un seuil plus élevé (moins négatif, par exemple -20 dB) compte comme « silence » le bruit ambiant plus bas : coupe agressive. Le rembourrage (0,15 s par défaut) est la marge de parole conservée de chaque côté de chaque coupe pour que le premier et le dernier mot de chaque segment ne soient pas rognés. Fonctionne aussi bien sur les fichiers audio que vidéo : sur la vidéo, l'image reste synchronisée avec les coupes audio car nous rognons les deux flux simultanément et réencodons le résultat.
Comment ça marche
- Déposez votre fichier audio ou vidéoPrend en charge tous les conteneurs vidéo courants (MP4 / MOV / WebM / MKV / AVI) et tous les formats audio courants (MP3 / WAV / M4A / OGG / FLAC / AAC / OPUS). La vidéo reste synchronisée avec les coupes audio.
- Réglez le seuil de silence (dB)-30 dB par défaut fonctionne pour la voix typique d'un podcast ou de Zoom. -40 dB pour les enregistrements très silencieux (un enfant qui dort à proximité, un seuil de bruit ambiant à respecter). -25 dB si votre audio est fort et que vous voulez des coupes agressives.
- Réglez le silence minimum (secondes)0,5 s par défaut conserve les pauses naturelles (« euh », temps de réflexion) et ne coupe que le temps mort plus long. Augmentez à 1,0 s pour des coupes plus conservatrices. Baissez à 0,3 s pour un rythme agressif.
- Réglez le rembourrage (secondes)0,15 s par défaut conserve une petite marge de parole de chaque côté de chaque coupe pour que les mots ne soient pas rognés. Augmentez à 0,25 s si vous entendez des fragments de mots aux points de coupe. Baissez à 0,05 s pour un rythme plus serré si votre parole est propre.
- Cliquez sur Supprimer les silencesLa passe 1 analyse l'audio (~10 % du temps total). La passe 2 rogne et concatène les segments de parole (~90 %). La sortie conserve le format source pour les entrées audio ; les entrées vidéo sortent toujours en MP4.