xAI, la empresa de Elon Musk, anunció el lanzamiento de Grok-1.5, una versión mejorada de su modelo de lenguaje grande (LLM) propio.
Programado para ser lanzado la próxima semana, Grok-1.5 presenta mejores capacidades de razonamiento y resolución de problemas, acercándose al rendimiento de LLMs abiertos y cerrados conocidos, como GPT-4 de OpenAI y Claude 3 de Anthropic.
Grok-1.5 es capaz de procesar contextos largos, aunque aún se queda atrás de la ventana de contexto de Gemini 1.5 Pro de hasta 1 millón de tokens.
Musk indicó que Grok-1.5 alimentará el chatbot de xAI que desafiará a ChatGPT en la plataforma X, mientras que Grok-2, el sucesor del nuevo modelo, aún está en fase de entrenamiento.
Afirmó que la próxima versión debería ser capaz de «superar a la IA actual en todas las métricas», pero no compartió detalles sobre cuándo podría estar disponible.
Grok-1.5 presenta mejoras significativas en comparación con el modelo anterior en todos los principales benchmarks, incluyendo aquellos relacionados con tareas de codificación y matemáticas. En las pruebas, el modelo alcanzó una puntuación del 50,6% en el benchmark MATH y del 90% en el benchmark GSM8K.
Además, Grok-1.5 tiene una ventana de contexto de hasta 128.000 tokens, lo que le permite procesar grandes cantidades de información de una vez. Lo que lo hace más adecuado para analizar, resumir y extraer información de documentos largos.
En el benchmark MMLU, su puntuación del 81,3% supera a Mistral Large, pero se queda atrás de Gemini 1.5 Pro, GPT-4 y Claude 3 Opus. Sin embargo, en el benchmark HumanEval, Grok-1.5 superó a todos los modelos, excepto a Claude 3 Opus.
xAI planea comenzar la implementación de Grok-1.5 la próxima semana. El modelo estará inicialmente disponible para testers iniciales y usuarios del chatbot Grok en la plataforma X.