Design market

José Alberto Lizana

José Alberto Lizana

La noche de este miércoles, la compañía de inteligencia artificial dirigida por Elon Musk, xAI, presentó su último modelo de IA: Grok 4. El anuncio se hizo en directo y estuvo lleno de promesas y afirmaciones ambiciosas sobre la gran evolución que promete esta inteligencia artificial, integrada actualmente en X (antes Twitter) y utilizada, en muchos casos, como herramienta de verificación de noticias… aunque con no pocos errores.

Grok es la respuesta de xAI —y de Musk— al auge de modelos como los de OpenAI y Google, capaces de analizar imágenes, responder preguntas complejas y mantener conversaciones contextuales. Sin embargo, esta nueva versión llega en un contexto complicado: Grok recientemente ha protagonizado titulares por emitir mensajes antisemitas o incluso por una “crisis de identidad” en la que se creía que era Elon Musk.

Las expectativas generadas por xAI son muy altas. Este nuevo modelo busca competir directamente con el esperado GPT-5 de OpenAI, previsto para ser lanzado a finales de este verano. Elon Musk no dudó en lanzar afirmaciones que lo mangnificaba:

Al igual que sus competidores, xAI también ha lanzado dos versiones de su IA: Grok 4 y Grok 4 Heavy. Esta última es una variante multiagente diseñada para lograr un rendimiento superior. Según explicó Musk, este modelo genera varios agentes que trabajan en paralelo sobre un mismo problema y luego comparan sus resultados para seleccionar la mejor solución.

Y si hablamos de los benchmarks según los datos proporcionados por xAI, Grok 4 ha obtenido un 25,4% en el benchmark Humanitys Last Exam (una prueba con miles de preguntas de ciencias, humanidades y matemáticas). Este resultado supera los 21,6% de Gemini 2.5 Pro de Google y el 21% del modelo o-3 de OpenAI.

No obstante, como ocurre habitualmente, estas cifras deben tomarse con cautela hasta que sean validadas por pruebas independientes. Algo que ya han hecho desde Artificial Analysis, que ha considerado que Grok 4 pasa a ser el modelo de IA número uno (siempre teniendo en cuenta que es el de la API). En los test GPQA Diamond consiguió una puntuación máxima de 88%, y sus resultados en el Humanitys Last Exam también confirman lo dicho por xAI. De esta manera, todas las expectativas generadas por Musk sobre su gran rendimiento parecen confirmarse de manera independiente.

Sobre el papel, Grok 4 promete ofrecer respuestas más profundas, elaboradas y fiables. Pero todavía está por ver cómo se comporta en el uso cotidiano, fuera de la API.

Junto con el lanzamiento de Grok 4, xAI ha estrenado un nuevo plan de suscripción llamado SuperGrok Heavy, con un precio de 300 dólares al mes. Esta suscripción da acceso anticipado a Grok 4 Heavy y otras funcionalidades exclusivas, en una estrategia que recuerda a los planes premium de OpenAI, Google o Anthropic.

Además, xAI ha confirmado que Grok 4 estará disponible vía API para que los desarrolladores puedan integrarlo en sus propias aplicaciones. Pero además, se va a poder usar a través de Super Grok.

En Genbeta | Por qué llamarle ingeniería del prompt cuando ingeniería del contexto es mejor para conseguir los mejores resultados con la IA

Los mejores comentarios:

Ver 0 comentarios

Webedia

Tecnología

Videojuegos

Entretenimiento

Gastronomía

Estilo de vida

Ediciones Internacionales

Más sitios que te gustarán

Reciente

Ver más artículos

Xataka
TV

Ver más vídeos