INTELIGENCIA ARTIFICIAL

Cómo funciona la nueva herramienta gratuita de Google para crear Podcast

Esta herramienta para crear resúmenes de audio de Google no están pensados para que coincidan con la voz de un podcaster específico
Por CD
TECNOLOGÍA - 26 de Noviembre, 2024

Una herramienta de inteligencia artificial (IA) poco conocida de Google se está volviendo viral por sus resúmenes de audio que imitan la cadencia del habla de los podcasters. A continuación, te explicamos cómo probarlo.

Se trata de la herramienta NotebookLM de Google y sus podcasts experimentales de IA, generados a través de documentos subidos con la función de resúmenes de audio. La magia de la herramienta de Google es que las personas pueden escuchar algo que normalmente no podrían encontrar en YouTube o en un podcast existente.

Por ejemplo, podés ingresar un documento de PowerPoint con 100 diapositivas sobre comercialización en la herramienta de Google y escuchar el resumen del podcast de ocho minutos mientras realizás otras tareas.

Presentado por primera vez el año pasado, NotebookLM es un asistente de investigación en línea de Google con características comunes para las herramientas de software de IA, como el resumen de documentos.

Pero es la opción Audio Overview, lanzada en septiembre, la que está capturando la imaginación de Internet. Los usuarios en línea están compartiendo fragmentos de sus podcasts de IA generativa hechos a partir de volcados de datos y probando las limitaciones de la herramienta a través de pruebas, como subir repetidamente palabras soeces.

¿Cómo generar un podcast con la IA de Google?

Las vistas generales de audio son una función de IA divertida para probar, porque no le cuestan nada al usuario: todo lo que necesita es un inicio de sesión de Google. Comenzá por iniciar sesión en tu cuenta personal de Google y visitá el sitio web de NotebookLM. Hacé clic en la flecha más que dice Nuevo cuaderno para comenzar a cargar tu material de origen.

Cada bloc de notas puede trabajar con hasta 50 documentos de origen, y estos no tienen por qué ser archivos guardados en el equipo. Google Docs y Slides son fáciles de importar. También podés subir sitios web y videos de YouTube, teniendo en cuenta algunas advertencias.

Solo se analizará el texto de los sitios web, no las imágenes ni el diseño, y la historia no se puede pagar. Para YouTube, NotebookLM de Google solo usará la transcripción de texto y los videos vinculados deben ser públicos.

Una vez que hayas colocado todos tus enlaces y documentos, deberás abrir la guía de NotebookLM de Google disponible en la esquina inferior derecha de la pantalla. Buscá la sección Descripción general de audio y hacé clic en el botón Generar. A continuación, deberás tener un poco de paciencia, ya que puede tardar unos minutos en cargarse, dependiendo de la cantidad de material de origen que estés utilizando en la herramienta de Google.

Una vez que la herramienta de Google genera el podcast de IA, podés crear un enlace para compartir al audio o simplemente descargar el archivo. Además, tenés la opción de ajustar tu velocidad de reproducción, en caso de que necesites que el podcast sea más rápido o lento.

El futuro de los podcasts de IA de Google

Internet se ha vuelto creativo con la función de audio de NotebookLM de Google, utilizándola para crear "inmersiones profundas" basadas en audio en temas técnicos complejos, generar archivos que resumen cuidadosamente trabajos de investigación densos y producir "podcasts" sobre sus rutinas personales de salud y acondicionamiento físico. Lo que plantea una pregunta importante: ¿Debería utilizar NotebookLM para revisar tus archivos más personales?

Los resúmenes generados a partir de NotebookLM están, según Google, completamente basados en el material de origen que un usuario sube. Es decir, tus datos personales no se utilizan para entrenar a NotebookLM, por lo que cualquier información privada o sensible que tengas en tus fuentes seguirá siendo privada, a menos que elijas compartir tus fuentes con los colaboradores. Por ahora, esta parece ser una de las ventajas de que Google le ponga una etiqueta de "experimental" a NotebookLM.

Según el encuadre de Google, la compañía solo está recopilando comentarios sobre el producto en este momento, siendo ágil y receptiva, jugando en un laboratorio, y NotebookLM está desvinculado de su negocio publicitario multimillonario. Pero atención, esto es por ahora.

Agregar opciones de audio a la NotebookLM en línea de Google Labs fue un momento transformador. Al cambiar la modalidad, se desbloquea un conjunto completamente nuevo de casos de uso. Lo que hace que NotebookLM de Google se destaque de todas las demás herramientas de IA generativa que se lanzaron a los usuarios en 2024 son, sorprendentemente, las palabras de relleno y el fraseo peculiar.

En lugar de la voz en off monótona que se puede esperar de voces de IA que resumen datos, la cadencia y las interpretaciones vocales de los podcasters sintéticos de NotebookLM suenan mucho menos forzadas.

¿La IA de Google reemplazará a los podcasters humanos?

¿Deberían los podcasters humanos estar temblando? La verdad es que no. Incluso si las herramientas de podcast de IA, como la de NotebookLM de Google, resultan ser resúmenes pegajosos y atractivos de información para el público en general, lo que aún está por verse, las voces sintéticas nunca imitarán completamente las conexiones sociales desarrolladas por los podcasters humanos.

Estos resúmenes de audio de Google no están pensados para que coincidan con la voz de un podcaster específico, sino con una especie de dúo idealizado de tu podcaster. Son fácilmente reconocibles a través de sus interjecciones y su estilo suelto de conversación con pausas pesadas.

Agregar más idiomas y acentos diversos es importante para esta herramienta de Google. En este momento, los hosts sintéticos están calibrados para conversaciones solo en inglés. Sin embargo, no esperes poder usar tu propia voz en las generaciones de podcasts de NotebookLM en el corto plazo.

La explosiva popularidad de los Audios Overviews de NotebookLM como parte de Google Labs, en lugar de como una característica dentro del chatbot Gemini, es un recordatorio de que las empresas de IA no están completamente seguras de lo que resonará con los usuarios hasta que el software esté disponible.

ChatGPT de OpenAI se lanzó originalmente como una vista previa de investigación, por ejemplo. Y dentro de la constante mezcla de anuncios de IA generativa, lo que sea que capture el espíritu de la época no es necesariamente la característica más comercializada o utilitaria, sino más bien la más entretenida.

Te puede interesar

Secciones