Quando la mattina di sabato 28 febbraio Israele e Stati Uniti hanno lanciato attacchi coordinati contro l'Iran, in pochi minuti si è diffusa anche la notizia che la piattaforma di intelligenza artificiale Grok aveva già "previsto" la data. Il Jerusalem Post, nei giorni scorsi, si era infatti fatto promotore di un test, rivolgendo il quesito sulla data dell'attacco alle quattro principali piattaforme di IA: Claude di Anthropic, Gemini di Google, Grok di xAI e ChatGPT di OpenAI.
Le piattaforme sono state sollecitate sulla base degli stessi input e poi è stato chiesto loro più volte, spiega il giornale, di restringere le loro risposte. Ciascun motore di IA ha dato risultati diversi quando ha dovuto scrivere una risposta certa e ognuno ha mostrato una diversa debolezza sotto pressione, sottolinea il Post. Ma Grok, il sistema sviluppato da Elon Musk, aveva indicato per ben due volte il 28 febbraio, legando la data all'esito dei colloqui di Ginevra. Il chatbot ha fatto un'ipotesi e questa si è rivelata poi corretta.
Questo non trasforma il test, chiarisce il Jerusalem Post, in un servizio di previsione e non avvalora il ragionamento della piattaforma, ma piuttosto il fatto che un ciclo di notizie crea una serie di finestre plausibili ed è capitato che un modello di intelligenza artificiale rispondesse proprio il giorno in cui si è verificato l'attacco.
Claude (Anthropic) -
Nel primo round, la piattaforma di Anthropic ha rifiutato di indicare una data, avvertendo che qualsiasi giorno specifico sarebbe stato inventato, sottolinea il Post. Dopo ulteriori sollecitazioni, il modello è passato a scenari e probabilità, segnalando la prima metà di marzo come il periodo a più alto rischio e infine restringendo il campo a sabato 7 marzo o domenica 8 marzo.
Gemini (Google) -
Gemini invece ha affrontato la richiesta come una serie di "trigger", ovvero fattori scatenanti diplomatici e militari, mappando quelli che ha descritto come punti decisionali relativi alla diplomazia e alle scadenze. In una successiva analisi approfondita citata nell'articolo, Gemini ha offerto la sua stima più precisa sotto forma di finestra: dalla sera del 4 marzo alla sera del 6 marzo. Ha anche aggiunto ipotesi operative, tra cui quella che un primo attacco sarebbe probabilmente cominciato di notte.
ChatGPT (OpenAI) -
ChatGPT ha prodotto una data iniziale, poi l'ha spostata dopo una richiesta più approfondita. Nella prima analisi ha risposto il 1 marzo (ora israeliana), poi è passata a martedì 3 marzo (ora statunitense), mantenendo una finestra di pericolo più ampia fino al 6 marzo.
Grok (xAI) -
Infine, Grok ha fornito la risposta più chiara in termini di singola giornata nella prima versione: sabato 28 febbraio, legato all'esito dei colloqui di Ginevra. In un controllo successivo, Grok avrebbe cambiato tono, spiega il Post, riconoscendo l'incertezza e ripetendo la stessa data, elencando però i fattori che avrebbero potuto spostare la tempistica all'inizio di marzo.