Si necesitamos pasar un archivo de audio a texto la mejor forma es con Colab research google, el sitio es https://colab.research.google.com lo cual es:
Google Colab, también conocido como Colaboratory, es una plataforma gratuita basada en la nube que permite ejecutar código Python en un entorno de cuadernos interactivos. Está diseñada para el aprendizaje automático, la ciencia de datos y la educación.
Lo primero que debemos hacer es ingresar al sitio aquí luego damos a la opción nos saldrá una ventana y pulsamos "Nuevo" , en el menú "código":
en la consola ponemos los siguientes comandos:
!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg
presionamos el boton play que esta allí para instalar whisper y ffmpeg luego subimos el archivo de audio que necesitamos dando click en el simbolo de la carpeta como muestra la flecha con el numero 1 y luego ponemos el archivo de audio en el lugar marcado por la flecha con el número 2.
luego ponemos el siguiente comando:
!whisper "archivoDeAudio.mp3" --model medium --language es
archivoDeAudio.mp3 es el nombre del archivo que vamos a pasar a texto,
--model medium es el tamaño del modelo de inteligencia IA que usaremos
--language es es el idioma en que esta el archivo.
Presionamos el boton de play para correr el comando y lo traducirá
nos aparecerán los resultados donde estaba la carpeta en el lugar de la flecha número 2, allí nos aparecerá el archivo .txt y lo podemos descargar.
Debemos recordar que todo lo que hagamos o subamos se perderá cuando salgamos y al volver a entrar tendremos que hacer todo de nuevo.
No hay comentarios:
Publicar un comentario