La empresa china de inteligencia artificial DeepSeek informó que el entrenamiento de su modelo R1 tuvo un costo de 294 mil dólares , una cifra muy inferior a la que reportan compañías estadounidenses del sector. El dato, publicado en la revista académica Nature , podría reavivar el debate sobre el papel de Pekín en la carrera global por el desarrollo de la IA.
Publicación en Nature
La actualización, considerada inusual, es la primera estimación pública de los costos de formación de R1. En el artículo, donde el fundador de la compañía, Liang Wenfeng , figura como coautor, se detalla que el modelo —centrado en el razonamiento— fue entrenado con 512 chips H800 de Nvidia durante 80 horas.
A paper in @Nature presents the methodology used to train a large-scale reasoning model