Microsoft dice que GPT-4 puede vencer a Google Gemini Ultra utilizando nuevas técnicas de prompt

Rene Fraga
2 minutos de lectura

Microsoft ha entrado en la intensa competencia entre los gigantes de la tecnología. Según la empresa, su modelo GPT-4 de OpenAI tiene el potencial de superar al poderoso Google Gemini Ultra mediante la aplicación de nuevas técnicas de prompt.

Recientemente, el equipo de investigación de Microsoft desarrolló el Medprompt, una combinación de estrategias de prompt que impulsa el rendimiento del GPT-4, logrando resultados líderes en MultiMedQA.

Microsoft no se detuvo ahí. Después del éxito de Medprompt, la empresa expandió sus técnicas de prompt a otros dominios.

Utilizando una versión modificada de Medprompt, GPT-4 alcanzó la puntuación más alta registrada en MMLU (comprensión lingüística multitarea a gran escala).

Punto de referenciaAviso GPT-4Resultados de GPT-4Resultados de Géminis Ultra
MMLUAviso médico+90,10%90,04%
GSM8KTiro cero95,27%94,4%
MATEMÁTICASTiro cero68,42%53,2%
evaluación humanaTiro cero87,8%74,4%
GRANDE-banco-duroPocos disparos + CoT*89,0%83,6% 
GOTATiro cero + CoT83,7%82,4%
HellaSwag10 disparos**95,3%87,8%

Sorprendentemente, estos resultados indican que aún no hemos explorado todo el potencial de los modelos lanzados anteriormente, como el GPT-4.

En contraste, Google Gemini Ultra, anunciado como el modelo más poderoso de la empresa hasta el momento, enfrenta un desafío formidable.

A medida que las técnicas de prompt evolucionan y las empresas buscan mejorar sus modelos, podemos esperar avances significativos en el campo de la inteligencia artificial.

Seguir:
Renê Fraga es fundador de Google Discovery y editor en jefe de Eurisko, un ecosistema editorial independiente dedicado a la tecnología, la ciencia y la innovación. Profesional del marketing digital, con posgrado por la ESPM, sigue de cerca a Google desde la década de 2000 y escribe desde hace más de 20 años sobre tecnología, productos digitales e inteligencia artificial. Fundó Google Discovery en 2006, convirtiéndolo en uno de los principales sitios especializados en Google en Brasil, y fue columnista de TechTudo (Globo.com).
No hay comentarios