Hace una hora

Avances de DeepSeek: la IA china aprende más cuando recibe recompensas humanas

Un estudio publicado en la revista Nature revela que el modelo DeepSeek-R1 incrementa sus capacidades cuando recibe estímulos por resolver problemas. Foto: Getty Images.

El modelo chino de inteligencia artificial DeepSeek -R1 ha demostrado que puede aprender más y mejor cuando se le aplican “recompensas” por cada problema resuelto. Así lo concluye un grupo de investigadores y tecnólogos, entre ellos los responsables de la empresa desarrolladora, tras publicar los resultados de su análisis en la revista científica Nature .

MODELO QUE RAZONA COMO LOS HUMANOS

El estudio detalla que DeepSeek-R1 incorpora una etapa de entrenamiento adicional bajo supervisión humana y emplea un sistem

See Full Page