Aunque ahora todo el mundo habla (y no para) del famoso ChatGPT , la gente de OpenAI tiene otros interesantes productos (gratuitos) accesibles a través de Internet.
Por ejemplo, MacWhisper es el software de transcripción gratuito que todos estábamos esperando.
Aunque hay otras herramientasde pago como son Otter.ai y Trint lo mejor de esta app es que utiliza Whisper de OpenAI.
Whisper es un sistema de reconocimiento automático de voz entrenado en 680.000 horas de datos supervisados multilingües y multitarea recopilados de la web. El uso de un conjunto de datos tan grande y diverso conduce a una mayor solidez a los acentos, el ruido de fondo y el lenguaje técnico. Además, permite la transcripción en varios idiomas, así como la traducción de esos idiomas al inglés.
OpenAI lanzó este programa gratuito increíblemente poderoso en septiembre de 2022 permitiendo a las personas con algunos conocimientos técnicos convertir sus archivos de audio y video en transcripciones increíblemente precisas. El problema era que no resultaba muy accesible para el usuario promedio, ya que necesitaba estar familiarizado con el uso de comandos en la aplicación Terminal.
Pero MacWhisper dispone una GUI (interfaz gráfica de usuario) que se basa en Whisper de OpenAI y oculta todas las cosas tecnológicas confusas, permitiéndole simplemente arrastrar y soltar su archivo de audio y obtener una transcripción muy rápidamente.
Además una de las mejores cosas de MacWhisper es que no necesita subir a Internet el archivo de audio o video que se desea transcribir haciéndose todo el trabajo en local.
MacWhisper es gratuito, pero hay una versión de pago del software (10$) que podría ser un poco más precisa porque utiliza los modelos de entrenamiento más complejos de OpenAI, pero la versión gratuita funcionará muy bien para la mayoría de las personas.
MacWhisper permite exportar las palabras transcritas en varios formatos que van desde el texto sin formato a CSV o incluso un formato de archivo de subtítulos como SRT y VTT.
Y afortunada,emte MacWhisper no es solo para inglés. Puede transcribir audio en 100 idiomas diferentes, lo cual es increíblemente útil. La única característica que MacWhisper que no tiene por ahora es la traducción de idiomas.
La otra característica que MacWhisper no tiene, aunque tampoco está disponible en Whisper de OpenAI, es la capacidad de diferenciar entre varias personas hablando. Por ejemplo, si está transcribiendo una entrevista con dos oradores, no hay marcas claras que muestren cuándo un orador se detuvo y otro comenzó.
También hay una función con MacWhisper en la que puede convertir el discurso del micrófono de su computadora en texto, lo que podría ser útil si desea transcribir algo sobre la marcha.
En cuanto vuelva a casa conecto mi MacBook Air, lo bajo y lo pruebo, claro.

La gente de OpenAI ha dejado en COLAB un ejemplo en Python para que puedas hacer tus propios modelos y aprender (algo) de como funciona esta tecnología
Hablando de ChatGPT, la gente ha introducido algunas “reglas” para evitar respuestas desafortunadas que atenten contra el buen gusto o incluso ilegales… pero alguien ya ha sido capaz de hacerle un tipo de jailbreak para evitar este tipo de censura.
Estos últimos días estoy probando ChatPDF y la verdad es que me encanta.
Tan solo tienes que “alimentarlo” con un PDF y luego pedirle que te haga un resumen o conteste a tus preguntas acerca del mismo… y todo ello en tu idioma preferido, por ejemplo