Proyecto GCP: Conversión de Texto a Audio y Audio a Texto con Google Cloud

Este es un proyecto creado en Google Cloud con el cual mediante una aplicación web desarrollada en Flask nos permite la conversión de texto a audio utilizando la API de Google Cloud Text-to-Speech, así como la transcripción de audio a texto con la API de Google Cloud Speech-to-Text.

⚠️ Importante: Este proyecto debe ejecutarse exclusivamente en el entorno de Cloud Shell de Google Cloud para garantizar la correcta instalación de dependencias y acceso a las credenciales de servicio.

🚀 Características

Convierte texto a audio en formato MP3.
Permite personalizar la voz con opciones de género y velocidad de habla.
Transcribe audio en español a texto.
Interfaz web intuitiva con controles de grabación y reproducción de audio.

🛠️ Requisitos previos

Antes de ejecutar la aplicación, asegúrate de tener los siguientes requisitos instalados en tu entorno de Cloud Shell:

Python 3.11 o superior (preinstalado en Cloud Shell)
Cuenta de Google Cloud con las APIs habilitadas:
- Text-to-Speech API gcloud services enable texttospeech.googleapis.com
- Speech-to-Text API gcloud services enable speech.googleapis.com
Dependencias del sistema: ffmpeg (Se instalará en el siguiente paso)

⚙️ Instalación

Sigue estos pasos para configurar y ejecutar el proyecto en Cloud Shell:

1. Clonar el repositorio

git clone https://github.com/vilcajoel/speech-text-and-text-to-speech-gcp.git
cd speech-text-and-text-to-speech-gcp

2. Crear un entorno virtual

Crea y activa un entorno virtual para aislar las dependencias del proyecto:

python3 -m venv venv
source venv/bin/activate

3. Instalar dependencias del sistema

Ejecuta el siguiente comando para instalar ffmpeg, necesario para el procesamiento de audio:

sudo apt-get update && sudo apt-get install -y ffmpeg

4. Instalar dependencias de Python

Instala las dependencias necesarias utilizando el archivo requirements.txt:

pip install -r requirements.txt

Contenido de requirements.txt:

Flask==3.0.0
google-cloud-texttospeech==2.14.1
google-cloud-speech==2.21.0
gunicorn==21.2.0

5. Ejecutar la aplicación

Inicia la aplicación Flask con el siguiente comando:

python app.py

La aplicación estará disponible en: http://127.0.0.1:5000

🌐 Uso de la aplicación

Conversión de Texto a Audio:
- Escribe el texto en el cuadro de texto.
- Selecciona el género de la voz (Neutral, Masculina o Femenina).
- Ajusta la velocidad de la voz.
- Haz clic en "Convertir a Audio" y escucha la reproducción.
Conversión de Audio a Texto:
- Presiona el botón "Iniciar Grabación".
- Graba tu voz y presiona "Detener Grabación".
- Obtén la transcripción en pantalla.

📂 Estructura del proyecto

.
├── app.py
├── requirements.txt
├── templates
│   └── index.html
├── Poc
│   └── app_speech_to_text
│   └── app_text_to_speech
└── README.md

🤝 Contribuciones

¡Las contribuciones son bienvenidas! Si deseas mejorar esta aplicación, por favor, haz un fork del repositorio y envía un pull request.

📄 Licencia

Este proyecto está bajo la licencia MIT. Consulta el archivo LICENSE para más detalles.

📞 Contacto

Para preguntas o sugerencias, contáctame en:

✉️ Email: joelvilcatarazona@gmail.com
🔗 LinkedIn: https://www.linkedin.com/in/joelvilca/
🐙 GitHub: https://github.com/vilcajoel

¡Espero que disfrutes usando esta aplicación! 🚀

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
PoC		PoC
templates		templates
.gitignore		.gitignore
README.md		README.md
WebApp.png		WebApp.png
app.py		app.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Proyecto GCP: Conversión de Texto a Audio y Audio a Texto con Google Cloud

🚀 Características

🛠️ Requisitos previos

⚙️ Instalación

1. Clonar el repositorio

2. Crear un entorno virtual

3. Instalar dependencias del sistema

4. Instalar dependencias de Python

5. Ejecutar la aplicación

🌐 Uso de la aplicación

📂 Estructura del proyecto

🤝 Contribuciones

📄 Licencia

📞 Contacto

About

Uh oh!

Releases

Packages

Languages

joelvilcat/speech-text-and-text-to-speech-gcp

Folders and files

Latest commit

History

Repository files navigation

Proyecto GCP: Conversión de Texto a Audio y Audio a Texto con Google Cloud

🚀 Características

🛠️ Requisitos previos

⚙️ Instalación

1. Clonar el repositorio

2. Crear un entorno virtual

3. Instalar dependencias del sistema

4. Instalar dependencias de Python

5. Ejecutar la aplicación

🌐 Uso de la aplicación

📂 Estructura del proyecto

🤝 Contribuciones

📄 Licencia

📞 Contacto

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages