Talonario Gnu/Linux: Pasar de audio a texto

viernes, 29 de noviembre de 2024

Pasar de audio a texto

Si necesitamos pasar un archivo de audio a texto la mejor forma es con Colab research google, el sitio es https://colab.research.google.com lo cual es:

Google Colab, también conocido como Colaboratory, es una plataforma gratuita basada en la nube que permite ejecutar código Python en un entorno de cuadernos interactivos. Está diseñada para el aprendizaje automático, la ciencia de datos y la educación.

Lo primero que debemos hacer es ingresar al sitio aquí luego damos a la opción nos saldrá una ventana y pulsamos "Nuevo" , en el menú "código":

colab resarch de google

en la consola ponemos los siguientes comandos:

!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg

presionamos el boton play que esta allí para instalar whisper y ffmpeg luego subimos el archivo de audio que necesitamos dando click en el simbolo de la carpeta como muestra la flecha con el numero 1 y luego ponemos el archivo de audio en el lugar marcado por la flecha con el número 2.

colab research de google audio a texto

luego ponemos el siguiente comando:

!whisper "archivoDeAudio.mp3" --model medium --language es

archivoDeAudio.mp3 es el nombre del archivo que vamos a pasar a texto,

--model medium es el tamaño del modelo de inteligencia IA que usaremos

--language es es el idioma en que esta el archivo.

Presionamos el boton de play para correr el comando y lo traducirá

nos aparecerán los resultados donde estaba la carpeta en el lugar de la flecha número 2, allí nos aparecerá el archivo .txt y lo podemos descargar.

Debemos recordar que todo lo que hagamos o subamos se perderá cuando salgamos y al volver a entrar tendremos que hacer todo de nuevo.

Talonario Gnu/Linux

viernes, 29 de noviembre de 2024

Pasar de audio a texto

No hay comentarios:

Publicar un comentario