Pesquisadores da Apple desenvolvem uma inteligência artificial que testa várias ideias em paralelo antes de responder.

Data de publicação: 30.04.2026

Avalie o artigo:

4.6/5 ( 83 votos )

Sumário:

Em um novo estudo, um grupo de pesquisadores da Apple detalha uma estrutura criativa que melhora as respostas de LLM em raciocínio matemático, geração de código e muito mais. Aqui estão os detalhes.

Difusão e Autoregressão, Combinadas

Pesquisadores da Apple, em colaboração com pesquisadores da Universidade da Califórnia, San Diego, detalham uma maneira interessante de aumentar a qualidade das respostas produzidas por grandes modelos de linguagem (LLMs) em áreas específicas em um novo estudo intitulado LaDiR: Difusão Secreta de LLMs para Raciocínio Textual.

No passado, comparamos modelos de difusão que geram texto iterando paralelamente sobre muitos tokens em cada passagem com modelos autoregressivos que funcionam calculando e prevendo tokens um a um.

A Apple também investigou modelos de difusão aplicados à previsão de dobramento de proteínas e codificação, o que é extremamente interessante.

O que o LaDiR faz, em resumo, é combinar ambas as abordagens: adota a difusão no processo de raciocínio e, em seguida, produz a saída final de forma autoregressiva.

Além disso, na verdade, executa muitos caminhos de raciocínio em paralelo; cada um conduz seu próprio processo de difusão e é apoiado por um mecanismo que os ajuda a explorar diferentes probabilidades, gerando assim várias respostas candidatas.

Os pesquisadores explicam que, no momento da inferência, quando o modelo essencialmente considera o que e como responder ao usuário, o LaDiR produz uma série de blocos de raciocínio ocultos que começam como um padrão (ou ruído) aleatório e são refinados para uma fase cada vez mais consistente.

Quando o modelo determina que raciocinou o suficiente, ele muda para produzir a resposta final de forma autoregressiva, gerando um token de cada vez.

Um detalhe importante é que o LaDiR pode executar vários desses caminhos de raciocínio em paralelo; isso é apoiado por um mecanismo que incentiva a exploração de diferentes probabilidades para evitar que todos os caminhos se direcionem muito cedo para a mesma ideia, assim não comprometendo o objetivo de todo o processo.

É importante ressaltar que o LaDiR não é um novo modelo, mas uma estrutura construída sobre modelos de linguagem existentes. Em vez de mudar completamente, altera a forma como um problema é raciocinado.

Desempenho do LaDiR

No estudo, os pesquisadores aplicaram o LaDiR ao modelo LLaMA 3.1 8B da Meta para raciocínio matemático e planejamento de quebra-cabeças, e ao modelo Qwen3-8B-Base para geração de código.

Nos critérios matemáticos, o LaDiR obteve uma precisão mais alta do que as abordagens existentes e mostrou um desempenho ainda mais forte em tarefas mais difíceis e fora da distribuição.

Nos critérios de geração de código, como o HumanEval, o LaDiR produziu saídas mais confiáveis e superou os ajustes padrão com uma diferença notável, especialmente em problemas mais difíceis.

E em tarefas de planejamento de quebra-cabeças, como o jogo Countdown, o LaDiR explorou uma gama mais ampla de respostas válidas do que qualquer modelo base e encontrou soluções corretas de forma mais confiável do que todos os modelos de propósito geral. No entanto, ficou atrás de um modelo específico e focado em tarefas em termos de precisão em uma única tentativa.

Embora alguns aspectos do artigo do LaDiR possam ser bastante técnicos, vale a pena ler se você estiver interessado na mecânica interna dos grandes modelos de linguagem e em abordagens inovadoras para melhorar o desempenho na geração de texto.

Siga este link para ler o artigo completo.

Etiquetas: Pesquisas Em İnteligência Artificial Grandes Modelos De Linguagem Métodos De Raciocínio Matemático

Comentários

(10 Comentários)

YA

Yıldız Acar

Este novo modelo de inteligência artificial parece realmente interessante. Especialmente o funcionamento paralelo dos processos de raciocínio pode nos permitir obter resultados mais criativos.
EK

Ege Korkmaz

A inovação da Apple pode ser um grande passo na área de inteligência artificial. No entanto, estou curioso para saber como será seu desempenho na fase de aplicação.
GT

Gizem Tuncer

A combinação de difusão e autoregressão do LaDiR é muito inovadora. Estou ansioso para ver como essa abordagem será utilizada na prática.
RÇ

Rüzgar Çetin

Esse tipo de desenvolvimento pode mudar nossa forma de pensar sobre inteligência artificial. Especialmente na área de produção de código, é importante obter resultados mais confiáveis.
SE

Suna Erdem

A obtenção de maior precisão no raciocínio matemático pode também contribuir significativamente na área da educação. Espero que seja integrado ao sistema educacional.
MR

Mavi Rüzgar

O desempenho do LaDiR é realmente impressionante. No entanto, como em toda nova tecnologia, este modelo também terá suas limitações.
SY

Serdar Yılmaz

Acompanhar as pesquisas da Apple é sempre emocionante. Estou ansioso para ver qual impacto este novo modelo terá na prática.
ZS

Zeynep Sönmez

Essas inovações relacionadas à inteligência artificial podem mudar significativamente os processos de desenvolvimento de software. Muito emocionante!
KA

Kıvanç Arslan

O fato de que este modelo pode fornecer melhores resultados em problemas mais difíceis é realmente notável. Acredito que encontrará mais áreas de aplicação no futuro.
LD

Lale Duman

A capacidade do LaDiR de gerar várias respostas candidatas pode melhorar a experiência do usuário. Espero obter melhores respostas, especialmente para perguntas complexas.