Es el momento «Her» de OpenAI

No, OpenAI no lanzó un competidor de motores de búsqueda para enfrentarse a Google en su evento de actualización de primavera del 13 de mayo de 2024. En su lugar, OpenAI presentó GPT-4 Omni (o GPT-4o para abreviar) con capacidades conversacionales muy humanas, y es realmente impresionante.

Además de hacer esta versión de ChatGPT más rápida y accesible para más personas, GPT-4o amplía la forma en que puedes interactuar con él, incluyendo la posibilidad de tener conversaciones naturales a través de la aplicación móvil o de escritorio. Dado que está disponible en iPhone, Android y aplicaciones de escritorio, podría convertirse en el asistente que todos hemos deseado (o temido).

GPT-4o: Más Emocional y Humano

GPT-4o ha dado un paso significativo hacia la comprensión de la comunicación humana, permitiendo conversaciones casi naturales. Ahora, puede manejar las interrupciones, entender el tono y reconocer cuando ha cometido un error.

Durante la primera demostración en vivo, el presentador pidió retroalimentación sobre su técnica de respiración, respirando pesadamente en su teléfono. ChatGPT respondió con una ingeniosa broma: «No eres una aspiradora». Luego aconsejó sobre una técnica de respiración más lenta, demostrando su capacidad para entender y responder a los matices humanos.

GPT-4o no solo tiene sentido del humor, sino que también puede cambiar el tono de sus respuestas y usar diferentes inflexiones para transmitir «pensamientos». Al igual que en una conversación humana, puedes interrumpir al asistente, corregirlo y hacer que reaccione o deje de hablar. Incluso puedes pedirle que hable en un tono, estilo o voz robótica específicos. Además, también puede proporcionar traducciones.

En una demostración en vivo sugerida por un usuario en X (anteriormente Twitter), dos presentadores en el escenario, uno hablando en inglés y el otro en italiano, tuvieron una conversación con ChatGPT-4o manejando la traducción. El asistente fue capaz de traducir rápidamente del italiano al inglés y luego devolver la respuesta en italiano sin problemas.

Entendimiento de Voz y Visuales

GPT-4o no solo entiende la voz, también puede comprender elementos visuales. Puede, por ejemplo, interpretar una ecuación lineal escrita y guiarte a través de su resolución. También puede analizar un selfie en vivo y describir lo que estás vistiendo o tus emociones.

En una de las demostraciones, GPT-4o comentó que el presentador parecía feliz y alegre. Aunque no está exento de fallos: en un momento, ChatGPT afirmó haber visto la imagen de una ecuación antes de que se escribiera, refiriéndose a una visual previa de una mesa de madera.

A lo largo de la demostración, ChatGPT funcionó rápidamente y no tuvo problemas para entender o preguntar sobre los problemas presentados. GPT-4o es más natural que escribir una consulta, ya que puedes hablarle a tu teléfono de manera fluida y obtener una respuesta deseada, en lugar de una que te sugiera buscar en Google.

Un Poco como «Samantha» en «Her»

Si estás pensando en «Her» o en otra película futurista-distópica con una IA, no eres el único. Hablar con ChatGPT de una manera tan natural es esencialmente el momento «Her» para OpenAI. Considerando que estará disponible en la aplicación móvil y como una aplicación de escritorio de forma gratuita, muchas personas pronto podrían tener sus propios momentos «Her».

Las impresionantes demostraciones tanto de voz como de visuales pueden ser solo el comienzo de lo que es posible. El rendimiento general y cómo funcionará GPT-4o en el día a día en diversos entornos aún está por verse, y una vez disponible, TechRadar lo pondrá a prueba. Aun así, después de esta vista previa, está claro que GPT-4o está preparado para competir con lo mejor que Google y Apple tienen para ofrecer en sus esperados lanzamientos de IA.

Perspectivas de GPT-4o

Anunciar esto un día antes del inicio de Google I/O y apenas unas semanas después de ver nuevos gadgets de IA en el mercado, como el Rabbit R1, OpenAI nos está dando una muestra de las experiencias de IA verdaderamente útiles que deseamos. Si esta rumoreada asociación con Apple se concreta, Siri podría recibir una gran mejora, y es casi seguro que Google mostrará sus últimos trucos de IA en el I/O el 14 de mayo de 2024. Pero, ¿será suficiente?

Nos hubiera gustado que OpenAI mostrara más demostraciones en vivo con el último ChatGPT-4o en lo que resultó ser una presentación de menos de 30 minutos, pero llena de contenido. Afortunadamente, se implementará para los usuarios en la próxima semana, y no tendrás que pagar para probarlo.