La carrera por desarrollar una inteligencia artificial general (AGI) aún tiene un largo camino por recorrer, según investigadores de Apple que encontraron que los principales modelos de IA todavía tienen problemas para razonar.
Las actualizaciones recientes de los principales modelos de lenguaje de gran escala (LLM) como ChatGPT de OpenAI y Claude de Anthropic han incluido modelos de razonamiento grandes (LRM), pero sus capacidades fundamentales, propiedades de escalabilidad y limitaciones “siguen siendo insuficientemente comprendidas,” dijeron los investigadores de Apple en un artículo de junio titulado “The Illusion of Thinking”.
Señalaron que las evaluaciones actuales se centran principalmente en benchmarks matemáticos y de codificación establecidos, “enfatizando la precisión de