Apple-Forscher haben eine KI entwickelt, die mehrere Ideen parallel testet, bevor sie antwortet.

Veröffentlichungsdatum: 30.04.2026

Artikel bewerten:

4.6/5 ( 83 Stimmen )

Inhaltsverzeichnis:

In einer neuen Studie erläutert eine Gruppe von Apple-Forschern einen kreativen Rahmen, der die Antworten von LLM in mathematischer Argumentation, Code-Generierung und mehr verbessert. Hier sind die Details.

Diffusion und Autoregression vereint

Die Apple-Forscher beschreiben zusammen mit Forschern der University of California, San Diego in einer neuen Studie mit dem Titel LaDiR: Geheime Diffusions-LLMs zur Textargumentation entwickeln einen interessanten Weg zur Verbesserung der Qualität der von großen Sprachmodellen (LLMs) in bestimmten Bereichen erzeugten Antworten.

In der Vergangenheit haben wir Diffusionsmodelle, die Text erzeugen, indem sie in jeder Iteration parallel über viele Tokens iterieren, mit autoregressiven Modellen verglichen, die Tokens einzeln berechnen und vorhersagen.

Apple hat auch Diffusionsmodelle untersucht, die auf die Vorhersage der Proteinstruktur und die Kodierung angewendet werden, was äußerst interessant ist.

Was LaDiR tut, ist kurz gesagt, beide Ansätze zu kombinieren: Es übernimmt die Diffusion im Argumentationsprozess und erzeugt dann die endgültige Ausgabe autoregressiv.

Darüber hinaus führt es tatsächlich viele Argumentationswege parallel aus; jeder führt seinen eigenen Diffusionsprozess durch und wird durch einen Mechanismus unterstützt, der es ihnen ermöglicht, verschiedene Wahrscheinlichkeiten zu erkunden, wodurch verschiedene Kandidatenantworten erzeugt werden.

Die Forscher erklären, dass das Modell im Wesentlichen zur Inferenzzeit darüber nachdenkt, was und wie es dem Benutzer antworten soll, und dass LaDiR eine Reihe von geheimen Argumentationsblöcken erzeugt, die jeweils als zufälliges Muster (oder Rauschen) beginnen und schrittweise zu einer konsistenteren Phase verfeinert werden.

Wenn das Modell feststellt, dass es ausreichend argumentiert hat, wechselt es zur autoregressiven Erzeugung der endgültigen Antwort, indem es ein Token nach dem anderen produziert.

Ein wichtiger Punkt ist, dass LaDiR in der Lage ist, mehrere dieser Argumentationswege parallel auszuführen; dies wird durch einen Mechanismus unterstützt, der es fördert, verschiedene Wahrscheinlichkeiten zu erkunden, um zu verhindern, dass alle Wege zu früh auf dieselbe Idee zusteuern, und so den Zweck des gesamten Prozesses nicht untergräbt.

Es ist wichtig zu betonen, dass LaDiR kein neues Modell ist, sondern ein Rahmen, der auf bestehenden Sprachmodellen aufbaut. Anstatt vollständig zu verändern, verändert es die Art und Weise, wie ein Problem argumentiert wird.

Die Leistung von LaDiR

In der Studie wendeten die Forscher LaDiR auf Meta's LLaMA 3.1 8B-Modell für mathematische Argumentation und Rätselplanung an, und auf das Qwen3-8B-Base-Modell für die Code-Generierung.

In mathematischen Maßstäben erzielte LaDiR eine höhere Genauigkeit als bestehende Ansätze und zeigte sogar bei schwierigeren, verteilungsfremden Aufgaben eine stärkere Leistung.

In den Maßstäben der Code-Generierung, wie HumanEval, erzeugte LaDiR zuverlässigere Ausgaben und übertraf die Standardanpassungen mit einem deutlichen Unterschied, insbesondere bei schwierigeren Problemen.

Und bei puzzleartigen Planungsaufgaben wie dem Countdown-Spiel entdeckte LaDiR ein breiteres Spektrum an gültigen Antworten als jedes Basis-Modell und fand zuverlässiger als alle allgemeinen Modelle korrekte Lösungen. Allerdings blieb es in der Genauigkeit bei einzelnen Versuchen hinter einem spezialisierten, aufgabenorientierten Modell zurück.

Einige Aspekte des LaDiR-Artikels können zwar recht technisch sein, aber wenn Sie an den inneren Abläufen großer Sprachmodelle und innovativen Ansätzen zur Verbesserung der Leistung in der Texterzeugung interessiert sind, ist es lesenswert.

Folgen Sie diesem Link, um den vollständigen Artikel zu lesen.

Schlagwörter: KI-Forschung Große Sprachmodelle Mathematische Schlussfolgerungsmethoden

Kommentare

(10 Kommentare)

YA

Yıldız Acar

Dieses neue KI-Modell sieht wirklich interessant aus. Besonders die parallele Arbeitsweise der Denkprozesse könnte uns kreativere Ergebnisse liefern.
EK

Ege Korkmaz

Diese Neuerung von Apple könnte ein großer Schritt im Bereich der künstlichen Intelligenz sein. Ich bin jedoch gespannt, wie die Leistung in der Anwendungsphase sein wird.
GT

Gizem Tuncer

Die Kombination von Diffusion und Autoregression bei LaDiR ist sehr innovativ. Ich kann es kaum erwarten zu sehen, wie dieser Ansatz in der Praxis eingesetzt wird.
RÇ

Rüzgar Çetin

Solche Entwicklungen könnten unsere Denkweise über künstliche Intelligenz verändern. Besonders wichtig ist es, zuverlässigere Ergebnisse im Bereich der Code-Generierung zu erzielen.
SE

Suna Erdem

Eine höhere Genauigkeit im mathematischen Denken könnte auch einen großen Beitrag im Bildungsbereich leisten. Ich hoffe, dass es auch in das Bildungssystem integriert wird.
MR

Mavi Rüzgar

Die Leistung von LaDiR ist wirklich beeindruckend. Aber wie bei jeder neuen Technologie wird auch dieses Modell seine Einschränkungen haben.
SY

Serdar Yılmaz

Es ist immer aufregend, Apples Forschungen zu verfolgen. Ich kann es kaum erwarten zu sehen, welche Auswirkungen dieses neue Modell in der Praxis haben wird.
ZS

Zeynep Sönmez

Solche Innovationen im Bereich der künstlichen Intelligenz könnten insbesondere die Softwareentwicklungsprozesse erheblich verändern. Sehr aufregend!
KA

Kıvanç Arslan

Dass dieses Modell bei schwierigeren Problemen bessere Ergebnisse liefert, ist wirklich bemerkenswert. Ich denke, dass es in Zukunft mehr Anwendungsbereiche finden wird.
LD

Lale Duman

Die Fähigkeit von LaDiR, verschiedene Antwortvorschläge zu generieren, könnte die Benutzererfahrung verbessern. Besonders hoffe ich auf bessere Antworten bei komplexen Fragen.