Whisper + BingChat

Ontem eu precisei fazer uma transcrição de algumas aulas em podcast, ai lembrei do excelente texto do @cardoso sobre o #whisper.

Vou mostrar como eu usei o whisper e o Bingchat para fazer todo o trabalho pesado.

Após seguir o passo a passo do @cardoso que inclusive está muito mastigado eu comecei a fazer as transcrições, porém eu já queria fazer tudo de uma vez.

Whisper: Como usar IA para transcrever e traduzir áudios – Meio Bit

Criei 2 pastas uma MP3 e outra WAV para ficar mais organizado.

Como eu não tenho paciência, eu usei um laço de repetição:

for %i in (1 2 3 4 5) do ffmpeg -i c:\whisper\mp3\EDU510_4_%i.mp3 -ar 16000 -ac 1 -c:a pcm_s16le c:\whisper\wav\edu510_4_%i.wav && main -f c:\whisper\wav\edu510_4_%i.wav -l portuguese -m ggml-small.bin –output-txt

Esse comando é um exemplo de um loop for, que é uma estrutura de repetição que executa um comando para cada item em um conjunto de arquivos, diretórios ou strings de texto. Nesse caso, o comando é:

Para cada valor de %i no conjunto (1 2 3 4 5), faça:

Execute o programa ffmpeg com os parâmetros -i c:\whisper\mp3\EDU510_4_%i.mp3 -ar 16000 -ac 1 -c:a pcm_s16le c:\whisper\wav\edu510_4_%i.wav

Esse programa converte o arquivo de áudio mp3 em wav com as especificações dadas

Em seguida, execute o programa main com os parâmetros -f c:\whisper\wav\edu510_4_%i.wav -l portuguese -m ggml-small.bin –output-txt

Esse o #whisper faz a transcrição do arquivo wav e gera um arquivo de texto como saída.

O símbolo && significa que o segundo comando só será executado se o primeiro for bem-sucedido. Portanto, esse loop for executa dois comandos para cada arquivo mp3 no conjunto, gerando um arquivo wav e um arquivo txt para cada um.

E o #binchat?

Quando o #whisper salva o arquivo ele em texto sem formatação sem nada, e eu queria deixar bonitinho. Então abri o arquivo no Edge:

Depois perguntei:

você entende o contexto dessa página? você consegue formatar usando markdown?

Bastou clicar em:

Sim, por favor. Formate usando markdown

Agora eu tenho um texto formatado.

Colando no word fica assim:

Eu ainda posso salvar isso em #PDF, abrir novamente no #Edge e pedir para ele fazer um resumo:

Deixe um comentário