Sobre o Cortar silêncios
A ferramenta Auto-Cut Silence do AntiUpload encontra os trechos de silêncio na gravação de um podcast ou vídeo e os corta, deixando intacta a fala (ou qualquer outro conteúdo não silencioso). É o recurso de remoção de silêncios do Descript / Adobe Podcast Enhance / Riverside, grátis e rodando localmente no seu navegador via o filtro "silencedetect" do FFmpeg. O fluxo de duas passagens: a passagem 1 analisa o áudio em busca de trechos mais silenciosos que seu limite (-30 dB por padrão) que durem mais que seu mínimo (0,5 s por padrão), e emite pares de marcas de tempo silence_start / silence_end. A passagem 2 os inverte em intervalos de fala (com um preenchimento configurável para que as palavras não sejam cortadas nos pontos de corte), constrói um grafo filter_complex que recorta cada intervalo de fala e os concatena de volta.
A economia importa: Descript cobra US$ 24/mês pela suíte de edição que inclui esse recurso; Adobe Podcast (o concorrente gratuito mais próximo) limita o plano gratuito a 1 hora/mês com problemas de qualidade intermitentes. Nossa ferramenta roda localmente, não tem limite de tempo e produz saída previsível (você controla o limite e o preenchimento, não um modelo de aprendizado de máquina opaco). O compromisso: usamos um detector de silêncio simples baseado em energia (silencedetect do FFmpeg), não o detector consciente da fala que o Descript usa. Se você tem música de fundo que em alguns pontos cai abaixo do limite, nossa ferramenta vai cortar; o modelo do Descript sabe "ainda há música por baixo, não corte". Para conteúdo de voz pura (podcasts sem música de fundo, mensagens de voz, gravações de reuniões), o detector simples iguala o comportamento do detector inteligente sem custo algum.
O limite (-30 dB por padrão) e a duração mínima de silêncio (0,5 s por padrão) são os dois controles principais. Um limite mais baixo (mais negativo, ex. -40 dB) corta só as partes realmente silenciosas: mais seguro, conservador. Um mais alto (menos negativo, ex. -20 dB) conta como "silêncio" o ruído ambiente mais baixo: corte agressivo. O preenchimento (0,15 s por padrão) é a margem de fala mantida em cada lado de cada corte para que a primeira e a última palavra de cada segmento não sejam cortadas. Funciona tanto com arquivos de áudio quanto de vídeo: em vídeo, a imagem permanece sincronizada com os cortes de áudio porque recortamos os dois fluxos ao mesmo tempo e recodificamos o resultado.
Como funciona
- Solte seu arquivo de áudio ou vídeoAceita todos os contêineres de vídeo comuns (MP4 / MOV / WebM / MKV / AVI) e todos os formatos de áudio comuns (MP3 / WAV / M4A / OGG / FLAC / AAC / OPUS). O vídeo permanece sincronizado com os cortes de áudio.
- Ajuste o limite de silêncio (dB)-30 dB por padrão funciona para a voz típica de podcast ou Zoom. -40 dB para gravações muito silenciosas (criança dormindo perto, piso de ruído ambiente que precisa ser respeitado). -25 dB se seu áudio é alto e você quer cortes agressivos.
- Ajuste o silêncio mínimo (segundos)0,5 s por padrão preserva as pausas naturais ("hum", tempo de reflexão) e corta só o tempo morto mais longo. Aumente para 1,0 s para cortes mais conservadores. Diminua para 0,3 s para um ritmo agressivo.
- Ajuste o preenchimento (segundos)0,15 s por padrão preserva uma pequena margem de fala em cada lado de cada corte para que as palavras não sejam cortadas. Aumente para 0,25 s se ouvir fragmentos de palavras nos pontos de corte. Diminua para 0,05 s para um ritmo mais ajustado se sua fala é limpa.
- Clique em Remover silênciosA passagem 1 analisa o áudio (~10% do tempo total). A passagem 2 recorta e concatena os segmentos de fala (~90%). A saída preserva o formato de origem para entradas de áudio; entradas de vídeo sempre saem como MP4.