• Latest
  • Trending
  • All
  • Política
  • Quintana Roo
GPT-4O: EL MODELO MULTIMODAL QUE ANALIZA  TEXTO, AUDIO Y VISIÓN EN UNA SOLA RED NEURONAL

GPT-4O: EL MODELO MULTIMODAL QUE ANALIZA TEXTO, AUDIO Y VISIÓN EN UNA SOLA RED NEURONAL

mayo 14, 2024
GOBERNADORA MARA LEZAMA ENTREGÓ DOMO ESCOLAR EN XUL-HA TRAS 63 AÑOS DE ABANDONO

GOBERNADORA MARA LEZAMA ENTREGÓ DOMO ESCOLAR EN XUL-HA TRAS 63 AÑOS DE ABANDONO

julio 14, 2025
ASEGURÓ LA SECRETARIA DE SEGURIDAD CIUDADANA MÁS DE 2 MIL DOSIS DE NARCÓTICOS Y 75 VEHÍCULOS VINCULADOS A DELITOS EN SOLO UNA SEMANA EN QUINTANA ROO

ASEGURÓ LA SECRETARIA DE SEGURIDAD CIUDADANA MÁS DE 2 MIL DOSIS DE NARCÓTICOS Y 75 VEHÍCULOS VINCULADOS A DELITOS EN SOLO UNA SEMANA EN QUINTANA ROO

julio 14, 2025
PRESIDENTA SHEINBAUM ANUNCIA DEMANDA POR DIFAMACIÓN TRAS SEÑALAMIENTOS DEL ABOGADO DE OVIDIO GUZMÁN Y RESALTA BAJA DE 70.5% EN HOMICIDIOS

PRESIDENTA SHEINBAUM ANUNCIA DEMANDA POR DIFAMACIÓN TRAS SEÑALAMIENTOS DEL ABOGADO DE OVIDIO GUZMÁN Y RESALTA BAJA DE 70.5% EN HOMICIDIOS

julio 14, 2025
PROGRAMA VIVIENDA PARA EL BIENESTAR REGISTRA MÁS DE 138 MIL OBRAS EN CURSO RUMBO A LA META DE 186 MIL VIVIENDAS EN 2025

PROGRAMA VIVIENDA PARA EL BIENESTAR REGISTRA MÁS DE 138 MIL OBRAS EN CURSO RUMBO A LA META DE 186 MIL VIVIENDAS EN 2025

julio 14, 2025
UNO DE CADA TRES MEXICANOS TIENE UN SEGUNDO EMPLEO; SUBOCUPACIÓN YA SUPERA LOS 5.3 MILLONES DE PERSONAS

UNO DE CADA TRES MEXICANOS TIENE UN SEGUNDO EMPLEO; SUBOCUPACIÓN YA SUPERA LOS 5.3 MILLONES DE PERSONAS

julio 14, 2025
PLAYA DEL CARMEN: SICARIOS ATACARON A POLICÍAS EN ENFRENTAMIENTO ARMADO; HAY DOS DETENIDOS

PLAYA DEL CARMEN: SICARIOS ATACARON A POLICÍAS EN ENFRENTAMIENTO ARMADO; HAY DOS DETENIDOS

julio 14, 2025
PRESIDENTA SHEINBAUM DESTACA AVANCES EN ACUERDO DE SEGURIDAD MÉXICO–EE.UU. CON ENFOQUE EN SOBERANÍA Y COMBATE AL TRÁFICO ILEGAL DE ARMAS

PRESIDENTA SHEINBAUM DESTACA AVANCES EN ACUERDO DE SEGURIDAD MÉXICO–EE.UU. CON ENFOQUE EN SOBERANÍA Y COMBATE AL TRÁFICO ILEGAL DE ARMAS

julio 14, 2025
RECALAN 40 TONELADAS DE SARGAZO EN PLAYA EL RIÍTO DE ISLA MUJERES; AUTORIDADES TRABAJAN PARA DEVOLVERLE SU IMAGEN CRISTALINA

RECALAN 40 TONELADAS DE SARGAZO EN PLAYA EL RIÍTO DE ISLA MUJERES; AUTORIDADES TRABAJAN PARA DEVOLVERLE SU IMAGEN CRISTALINA

julio 14, 2025
UNA MUJER FUE ASESINADA POR SU PAREJA EN LA REGIÓN 41 DE CANCÚN; EL FEMINICIDIO OCURRIÓ FRENTE A SUS DOS HIJOS MENORES

UNA MUJER FUE ASESINADA POR SU PAREJA EN LA REGIÓN 41 DE CANCÚN; EL FEMINICIDIO OCURRIÓ FRENTE A SUS DOS HIJOS MENORES

julio 14, 2025
SECRETARÍA DE MARINA REFUERZA ESTRATEGIA CONTRA EL SARGAZO EN QUINTANA ROO: SUMAN MÁS DE 44 MIL TONELADAS RETIRADAS EN 2025

SECRETARÍA DE MARINA REFUERZA ESTRATEGIA CONTRA EL SARGAZO EN QUINTANA ROO: SUMAN MÁS DE 44 MIL TONELADAS RETIRADAS EN 2025

julio 14, 2025
¿PLANEAS IR A LA PLAYA? ESTAS SON LAS ZONAS CON MENOS SARGAZO EN CANCÚN Y EL CARIBE MEXICANO ESTE 14 DE JULIO

¿PLANEAS IR A LA PLAYA? ESTAS SON LAS ZONAS CON MENOS SARGAZO EN CANCÚN Y EL CARIBE MEXICANO ESTE 14 DE JULIO

julio 14, 2025
TENISTA JANNIK SINNER DESATA INTENSA BATALLA POR EL NÚMERO 1 DEL ATP TRAS VICTORIA EN WIMBLEDON          Preguntar a ChatGPT

TENISTA JANNIK SINNER DESATA INTENSA BATALLA POR EL NÚMERO 1 DEL ATP TRAS VICTORIA EN WIMBLEDON Preguntar a ChatGPT

julio 14, 2025
lunes, julio 14, 2025
  • Login
  • INICIO
  • Q. Roo
    • Cancún
    • P. del Carmen
  • México y el mundo
  • Deportes
  • Más
    • Espectáculos
    • Huracanes
    • Gobierno del estado
    • Política
    • Especiales Macronews
    • Ciencia y Tecnología
    • Curiosidades
    • Películas Y Series
    • Libros Y Música
    • Desarrollo Humano
    • Análisis y opinión
      • Knock-out Político
No Result
View All Result
  • INICIO
  • Q. Roo
    • Cancún
    • P. del Carmen
  • México y el mundo
  • Deportes
  • Más
    • Espectáculos
    • Huracanes
    • Gobierno del estado
    • Política
    • Especiales Macronews
    • Ciencia y Tecnología
    • Curiosidades
    • Películas Y Series
    • Libros Y Música
    • Desarrollo Humano
    • Análisis y opinión
      • Knock-out Político
No Result
View All Result
No Result
View All Result
Home Diversión Ciencia y Tecnología

GPT-4O: EL MODELO MULTIMODAL QUE ANALIZA TEXTO, AUDIO Y VISIÓN EN UNA SOLA RED NEURONAL

by MACRONEWS
2024/05/14
in Ciencia y Tecnología
0
GPT-4O: EL MODELO MULTIMODAL QUE ANALIZA  TEXTO, AUDIO Y VISIÓN EN UNA SOLA RED NEURONAL
495
SHARES
1.4k
VIEWS
Share on FacebookShare on TwitterWhatsapp

ChatGPT ya podía escuchar y hablar, pero no como ahora. OpenAI ha revelado su nuevo modelo de inteligencia artificial, GPT-4o, que destaca no solo por ser más potente, sino también por sus capacidades para tener conversaciones en tiempo real, con todo y entonaciones de voz, prácticamente de la misma forma que lo haría un humano.

Durante una actualización de primavera, OpenAI mostró qué es capaz de realizar este nuevo modelo de IA, resolver ecuaciones en tiempo real, analizar código, pero también contar historias en tiempo real (cambiando de entonación a gusto del usuario), servir como traductor instantáneo, y hasta siendo capaz de analizar el rostro de una persona.
LEER:INTELIGENCIA ARTIFICIAL PREDICE PRÓXIMA PRESIDENTA DE MÉXICO, CON CLAUDIA SHEINBAUM COMO CLARA FAVORITA

Explicando el modelo

De acuerdo con OpenAI, GPT-4o es un nuevo modelo multimodal capaz de utilizar de forma nativa diferentes entradas de contenido, audio, visión, y texto en tiempo real, lo que vuelve la interacción «mucho más natural«, siendo también más rápido en sus respuestas.

Esto se debe a una nueva forma de entrenamiento, de extremo a extremo, donde la IA procesa en la misma red neuronal todas las entradas y salidas de texto, visión y audio.

De forma simple, este cambio altera la manera en que analizaba el contenido. Hasta ahora, la IA debía realizar tres pasos: transcribir una entrada de audio a texto, generar el texto de la respuesta y convertirla en audio nuevamente para compartirla con el usuario.

Este proceso hacía que ChatGPT perdiera información al no poder analizar detalles como tonos, o si había múltiples participantes, pero también limitándose en su capacidad para emitir risas, cantar o expresar emociones.

Justamente esa es una de las áreas que mejoran con GPT-4o, pues ahora la IA, además de poder mantener las conversaciones en tiempo real, también puede agregar tonos y transmitir distintas emociones en su voz, e interactuar en tiempo real con contenido, gracias a una función de cámara en vivo dentro de su app para smartphones.

Según la compañía, GPT-4o tiene un rendimiento de nivel GPT-4 Turbo en texto, pero también en los apartados de razonamiento e inteligencia de codificación, aunque utiliza menos tokens para poder procesar el contenido, haciéndolo «más económico«, algo especialmente útil para los desarrolladores que utilizan su API.

Las demostraciones de GPT-4o

En la presentación se mostraron algunos de estos detalles, pues al solicitarle contar una historia, distintos usuarios podían pedir cambios en la manera de contarla, pronunciarla de forma «más emotiva» o hasta cambiar la narración por una voz robótica.

Demostracion Historia Gpt 4oLa demostración de GPT-4o contando una historia

El nuevo modelo también se probó en otros entornos, ayudando a los presentadores a resolver una ecuación lineal, paso a paso en tiempo real mientras apuntaban la cámara de su smartphone al problema, y para hacer traducciones entre dos personas, de italiano a inglés, de forma prácticamente instantánea.

Al igual que los otros modelos, GPT-4o es capaz de analizar también código paso a paso, y dar retroalimentación al usuario sobre cómo funciona, pero también con explicaciones de información que se encuentre en formato de gráfica, por ejemplo.

Disponibilidad de GPT-4o

Uno de los elementos más destacados de este nuevo modelo es que estará disponible prácticamente para todos los usuarios, es decir, llegará tanto de forma gratuita, aunque con limitaciones, como para aquellos que estén suscritos en algunos de sus planes.

Según OpenAI, desde el miércoles 13 de mayo se estarán implementando en ChatGPT las capacidades de texto e imagen del modelo de forma gratuita, y para los usuarios Plus habrá límites de mensajes hasta cinco veces mayores.

Por otro lado, el nuevo modo de voz, una de las funciones estrella del modelo, llegará únicamente para los suscriptores en versión alfa en las próximas semanas.

Para los desarrolladores que usan la API de la IA también hay beneficios, pues GPT-4o es un modelo, dice OpenAI, dos veces más rápido, a mitad de precio y con límites de velocidad más altos en comparación con GPT-4 Turbo.

Además de GPT-4o, la compañía también mostró una nueva aplicación de escritorio, que tendrá un comando específico para hacer consultas sobre algún contenido de forma instantánea, ya sea seleccionado texto o tomando capturas de pantalla.

De momento esta función será exclusiva para macOS y para usuarios Plus, pero la compañía tiene contemplado lanzar una versión para Windows a finales de 2024.

FUENTE:XATAKA

Share198Tweet124Send
MACRONEWS

MACRONEWS

No Result
View All Result

¿Buscas anunciarte en Playa del Carmen?

Anunciate en Quintana Roo

Grupo Macro te ofrece los mejores puntos de publicidad en exterior de Playa del Carmen. Accesos de playa, destinos turísticos y mucho más. Conoce todos los detalles aquí


Copyright © 2018 Macronews.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • INICIO
  • Q. Roo
    • Cancún
    • P. del Carmen
  • México y el mundo
  • Deportes
  • Más
    • Espectáculos
    • Huracanes
    • Gobierno del estado
    • Política
    • Especiales Macronews
    • Ciencia y Tecnología
    • Curiosidades
    • Películas Y Series
    • Libros Y Música
    • Desarrollo Humano
    • Análisis y opinión
      • Knock-out Político

Copyright © 2018 Macronews.