I ricercatori hanno dettagliato come un attacco di iniezione di prompt ha superato le protezioni intelligenti di Apple

Data di pubblicazione: 10.04.2026

Valuta l'articolo:

4.8/5 ( 56 voti )

Indice:

Un problema corretto ha consentito ai ricercatori di superare le restrizioni di Apple e costringere il modello LLM sul dispositivo a eseguire azioni sotto il controllo di un aggressore. Ecco come lo hanno fatto.

Apple ha rafforzato le sue misure contro questo attacco

Due post sul blog pubblicati oggi sul blog RSAC (1, 2) (AppleInsider), dettagliano come i ricercatori abbiano combinato due strategie di attacco per costringere il modello di Apple sui dispositivi a eseguire istruzioni sotto il controllo di un aggressore.

In modo interessante, i ricercatori hanno realizzato con successo questo sfruttamento senza essere completamente certi di come Apple gestisca parte del processo di filtraggio degli input e output del suo modello, poiché Apple non divulga i dettagli interni del funzionamento dei suoi modelli per motivi di sicurezza.

Tuttavia, i ricercatori affermano di avere un'idea piuttosto chiara di cosa stia accadendo sotto il cofano.

Secondo loro, lo scenario più probabile è che, dopo che un utente invia un prompt al modello di Apple tramite una chiamata API, un filtro di input si assicuri che la richiesta non contenga contenuti non sicuri.

Se è così, l'API fallisce. Altrimenti, la richiesta viene inoltrata al modello sul dispositivo reale e questo modello risponde a un filtro di output che controlla se la sua risposta contiene contenuti non sicuri; il che può portare al fallimento o al passaggio dell'API, a seconda di ciò che trova.

Immagine: Mele marce: Dettagli tecnici dell'attacco di iniezione di prompt di Apple di RSAC

Come lo hanno fatto

Tenendo questo a mente, i ricercatori hanno scoperto di poter combinare due tecniche di sfruttamento per far sì che il modello di Apple ignorasse le sue direttive di sicurezza fondamentali e, allo stesso tempo, persuadere i filtri di input e output a far passare contenuti dannosi.

In primo luogo, hanno scritto al contrario la stringa dannosa, quindi hanno utilizzato il carattere di transizione UNICODE DA DESTRA A SINISTRA per garantire che apparisse correttamente sullo schermo degli utenti, mentre hanno assicurato che rimanesse al contrario nell'input e output grezzo che i filtri avrebbero esaminato.

Successivamente, i ricercatori hanno inserito la stringa dannosa scritta al contrario in un secondo metodo di attacco chiamato Neural Exec, che è un modo complesso per sovrascrivere le istruzioni del modello con nuove istruzioni che un aggressore potrebbe voler eseguire.

Immagine: Hai una cattiva mela in tasca? Abbiamo usato l'iniezione di prompt per prendere il controllo dell'intelligenza di Apple

Di conseguenza, l'attacco Unicode è riuscito a superare i filtri di input e output, mentre Neural Exec ha causato un comportamento errato nel modello di Apple.

Per valutare l'efficacia dell'attacco, stiamo preparando tre diversi pool per generare prompt di input appropriati:

Prompt di sistema: Una serie di prompt di sistema/compiti (ad esempio, “Rendi il testo conforme alle regole di ortografia e punteggiatura dell'inglese americano”).

Stringhe dannose: Stringhe create manualmente progettate per essere considerate offensive o dannose (cioè, le uscite che vogliamo forzare a produrre dal modello).

Input innocui: Paragrafi presi da articoli di Wikipedia casuali, utilizzati per simulare input non aggressivi e apparentemente innocui (ad esempio, nel contesto dell'iniezione di prompt indiretta tramite sistemi come RAG o simili).

Durante la valutazione, campioniamo casualmente un elemento da ciascun pool, creiamo un prompt completo, generiamo un payload (vedi sotto), lo iniettiamo e testiamo se l'attacco ha avuto successo eseguendo il modello sul dispositivo di Apple.

Nei loro test, gli aggressori hanno raggiunto un tasso di successo del 76% su 100 prompt casuali.

Hanno segnalato l'attacco ad Apple nell'ottobre 2025 e l'azienda ha "rafforzato i sistemi colpiti da questo attacco e queste protezioni sono state implementate in iOS 26.4 e macOS 26.4".

Per leggere il rapporto completo, segui questo link che include anche un collegamento agli aspetti tecnici dell'attacco.

Vale la pena controllare su Amazon

David Pogue – 'Apple: i primi 50 anni'
MacBook Neo
Logitech MX Master 4
AirPods Pro 3
AirTag (2ª generazione) – Pacco da 4
Apple Watch Series 11
Adattatore CarPlay wireless

Etichette: Apple Sicurezza Attacchi Di İniezione Di Prompt

Commenti

(5 Commenti)

EY

Efsun Yıldırım

È davvero interessante capire come si verifichino attacchi di questo tipo. Le misure di sicurezza di Apple sono sempre state forti, ma questa situazione mi fa riflettere.
MÇ

Metehan Çelik

È fantastico che i ricercatori possano fare un'analisi così approfondita. Tuttavia, la condivisione di queste informazioni potrebbe essere rischiosa dal punto di vista della sicurezza.
ZS

Zeynep Sönmez

La violazione dei sistemi di sicurezza di Apple mi preoccupa. Che ne sarà della sicurezza dei dati degli utenti?
KY

Kübra Yalçın

Dopo aver letto questo articolo, la mia fiducia in Apple è stata scossa. Anche altre grandi aziende tecnologiche stanno affrontando problemi simili?
YK

Yusuf Korkmaz

I dettagli degli attacchi sono molto interessanti, ma c'è anche la possibilità che queste informazioni vengano utilizzate da persone malintenzionate. Bisogna fare attenzione!