Investigadores de Apple desarrollan una inteligencia artificial que prueba múltiples ideas en paralelo antes de responder.

Fecha de publicación: 30.04.2026

Califica el artículo:

4.6/5 ( 83 votos )

Índice:

En un nuevo estudio, un grupo de investigadores de Apple detalla un marco creativo que mejora las respuestas de los LLM en razonamiento matemático, generación de código y más. Aquí están los detalles.

Difusión y Autoregresión, Combinados

Los investigadores de Apple, junto con investigadores de la Universidad de California, San Diego, detallan un nuevo estudio titulado LaDiR: Difusión Oculta de LLMs para el Razonamiento Textual, que describe una forma interesante de mejorar la calidad de las respuestas producidas por los grandes modelos de lenguaje (LLMs) en áreas específicas.

En el pasado, comparamos los modelos de difusión que generan texto iterando en paralelo sobre muchos tokens en cada paso, con modelos autoregresivos que calculan y predicen los tokens uno por uno.

Apple también examinó modelos de difusión aplicados a la predicción del plegamiento de proteínas y la codificación, lo cual es extremadamente interesante.

Lo que hace LaDiR, en resumen, es combinar ambos enfoques: adopta la difusión en el proceso de razonamiento y luego produce la salida final de manera autoregresiva.

Además, en realidad ejecuta muchos caminos de razonamiento en paralelo; cada uno lleva a cabo su propio proceso de difusión y está respaldado por un mecanismo que les permite explorar diferentes probabilidades, generando así diversas respuestas candidatas.

Los investigadores explican que, en el momento de la inferencia, cuando el modelo determina esencialmente qué y cómo responder al usuario, LaDiR produce una serie de bloques de razonamiento oculto que comienzan como un patrón (o ruido) aleatorio y se refinan a una etapa cada vez más coherente.

Cuando el modelo determina que ha razonado lo suficiente, pasa a generar la respuesta final de manera autoregresiva, produciendo un token a la vez.

Un detalle importante es que LaDiR puede ejecutar varios de estos caminos de razonamiento en paralelo; esto está respaldado por un mecanismo que fomenta la exploración de diferentes probabilidades para evitar que todos los caminos se dirijan demasiado pronto hacia la misma idea, de modo que no se comprometa el propósito de todo el proceso.

Es importante señalar que LaDiR no es un nuevo modelo, sino un marco construido sobre modelos de lenguaje existentes. En lugar de cambiar completamente, modifica la forma en que se razona un problema.

El Rendimiento de LaDiR

En el estudio, los investigadores aplicaron LaDiR al modelo LLaMA 3.1 8B de Meta para razonamiento matemático y planificación de rompecabezas, y al modelo Qwen3-8B-Base para generación de código.

En métricas matemáticas, LaDiR logró una mayor precisión que los enfoques existentes y mostró un rendimiento más fuerte incluso en tareas más difíciles y fuera de distribución.

En métricas de generación de código, como HumanEval, LaDiR produjo salidas más confiables y superó claramente los ajustes estándar, especialmente en problemas más difíciles.

Y en tareas de planificación de estilo rompecabezas, como el juego Countdown, LaDiR exploró un rango más amplio de respuestas válidas que cualquier modelo base y encontró soluciones correctas de manera más confiable que todos los modelos de propósito general. Sin embargo, se quedó atrás de un modelo específico y enfocado en la tarea en términos de precisión en un solo intento.

Aunque algunos aspectos del artículo de LaDiR pueden ser bastante técnicos, vale la pena leerlo si estás interesado en el funcionamiento interno de los grandes modelos de lenguaje y en enfoques innovadores para mejorar el rendimiento en la generación de texto.

Sigue este enlace para leer el artículo completo.

Etiquetas: İnvestigaciones De İnteligencia Artificial Modelos De Lenguaje Grandes Métodos De Razonamiento Matemático

Comentarios

(10 Comentarios)

YA

Yıldız Acar

Este nuevo modelo de inteligencia artificial realmente parece interesante. Especialmente el hecho de que los procesos de razonamiento funcionen en paralelo podría permitirnos obtener resultados más creativos.
EK

Ege Korkmaz

Esta innovación de Apple podría ser un gran paso en el campo de la inteligencia artificial. Sin embargo, tengo curiosidad por saber cómo se desempeñará en la fase de aplicación.
GT

Gizem Tuncer

La combinación de difusión y autorregresión de LaDiR es muy innovadora. Estoy ansioso por ver cómo se utilizará esta aproximación en la práctica.
RÇ

Rüzgar Çetin

Este tipo de desarrollos puede cambiar nuestra forma de pensar sobre la inteligencia artificial. Especialmente es importante obtener resultados más confiables en el área de producción de código.
SE

Suna Erdem

Lograr una mayor precisión en el razonamiento matemático también puede contribuir significativamente en el campo de la educación. Espero que se integre en el sistema educativo.
MR

Mavi Rüzgar

El rendimiento de LaDiR es realmente impresionante. Sin embargo, como ocurre con cada nueva tecnología, este modelo también tendrá sus limitaciones.
SY

Serdar Yılmaz

Seguir las investigaciones de Apple siempre es emocionante. Estoy ansioso por ver qué impacto tendrá este nuevo modelo en la práctica.
ZS

Zeynep Sönmez

Este tipo de innovaciones en inteligencia artificial puede cambiar significativamente los procesos de desarrollo de software. ¡Es muy emocionante!
KA

Kıvanç Arslan

Que este modelo produzca mejores resultados en problemas más difíciles es realmente notable. Creo que encontrará más áreas de aplicación en el futuro.
LD

Lale Duman

La generación de diversas respuestas candidatas por parte de LaDiR puede mejorar la experiencia del usuario. Especialmente espero obtener mejores respuestas para preguntas complejas.