segunda-feira, 22 de julho de 2024

Degravação de Conversas Exportadas do WhatsApp com Python e Whisper

Na semana passada, precisei instruir um processo criminal com uma conversa de WhatsApp que continha mensagens de texto, de áudio e de vídeo.

Para proceder à transcrição, observando a integridade dos arquivos e a sequência cronológica das mensagens, recorremos ao Python e à Inteligência Artificial, usando o Whisper, que é um modelo de fala de código aberto.

O script encontra os arquivos de áudio (opus) e vídeo (mp4) na pasta da conversa de WhatsApp exportada. Na sequência, lê o arquivo do chat, linha a linha. Quando acha referência às mídias, chama o método do Whisper para fazer a transcrição e a incorpora no texto.

Como de costume, compartilhei o código no GitHub, no repositório [transcreve_zap](https://github.com/jespimentel/transcreve_zap), para que possa ser reusado e aprimorado.

Também deixei uma demonstração de seu funcionamento no YouTube:[Degravação do WhatsApp com Python]( https://www.youtube.com/watch?v=M1hxhwUWl0M).

Fico à disposição para conversarmos sobre as estratégias usadas nesse programa.