Fare foto con l'intelligenza artificiale: ecco come funzionano DALL·E e Midjourney
L'intelligenza artificiale usata per creare immagini e foto. Ecco come utilizzare i due principali servizi sul mercato
COSA TROVERAI IN QUESTO ARTICOLO
Come fare le richieste giuste, imparare il prompting
DALL·E 2
Come funziona la registrazione di DALL·E 2
Il prompting di DALL·E
Trasformare altre immagini con DALL·E
Il costo di DALL·E
Midjourney
Registrarsi a Discord per usare Midjourney
Entrare nei canali #newbie di Midjourney
Il primo comando di Midjourney: \imagine
I risultati di Midjourney
I comandi extra di Midjourney
I consigli sull'uso di Midjourney
Quanto costa Midjourney
Creare foto con l'intelligenza artificiale è l'argomento che più coinvolge il pubblico italiano nelle ultime settimane. Chi non ha visto le immagini di Donald Trump arrestato o Putin in manette? Oppure Papa Francesco con indosso un piumino bianco in versione rapper? Sono tutte immagini fatte con l'Ai poi diventate virali. Ormai l'intelligenza artificiale fa parte della nostra vita e bisogna imparare a comprenderla per poterla utilizzare ma soprattutto evitare di essere travolti da questa tecnologia. Le implicazioni etiche e morali derivanti da questa rivoluzione non possono essere sottovalutate. Già ne avevamo parlato in occasione del boom fatto da ChatGpt che crea testi. Con le immagini diventano ancora più importanti le avvertenze d'uso. Anche perché questa tecnologia è nelle mani di tutti. Qui in questo articolo andremo ad analizzare alcuni dei software più utilizzati come DALL·E 2 o il famigerato Midjourney.
Come fare le richieste giuste, imparare il prompting Iniziamo con le basi. La creazione di immagini avviene con la tecnica del TTI, Text to image. Ma non crediate che sia possibile ricreare le immagini di cui abbiamo parlato sopra con una semplice richiesta. Quella del TTI è una vera e propria sfida fatta anche di comandi tecnici e soprattutto modifiche sempre più dettagliate. Quello di cui stiamo parlando si chiama prompting (una delle possibili professioni del futuro, tecnici in grado di dialogare con l'Ai). Il prompting è una scienza che spiega come mettere in comunicazione l'umano con la macchina. Nel caso delle immagini si parte da un concetto base da far generare al computer per poi entrare sempre più nello specifico. Ad esempio si possono chiedere delle aggiunte usando frasi come "una foto di" o "un dipinto di" oppure, ed è quello più utilizzato al momento, usare aggettivi e chiedere una immagine "realistica", "molto dettagliata", in "alta definizione". Ultima premessa, quasi tutti i software lavorano in inglese e quindi bisognerà usare questa lingua nel prompting. Ma anche in questo caso l'Ai ci aiuta, sono ormai tanti i traduttori che possono fare al caso nostro (Google translate, Smodin o perché no, ChatGpt/Edge di Microsoft).
DALL·E 2 Partiamo quindi da DALL·E 2. Si tratta di un sistema di intelligenza artificiale sviluppato da OpenAI (quelli di ChatGpt) che può creare immagini e opere d'arte realistiche partendo da una descrizione in linguaggio naturale. È un modello generativo che può combinare concetti, attributi e stili per creare immagini originali e realistiche. La cosa principale di Dall-E 2 è che lavora su foto, riuscendo anche ad apportare modifiche al contesto di una immagine caricata dall'utente.
Fotogallery - Come funziona DALL·E
Come funziona la registrazione di DALL·E 2 Per partire bisogna andare sul sito cliccando qui. Ci si registra coi soliti metodi, via mail oppure utilizzando il proprio account Google o Microsoft. Una volta registrati e inserito il proprio nome e cognome, bisognerà anche lasciare un proprio numero di telefono. Informazione necessaria perché è lì che arriverà il codice di controllo che permetterà l'uso del sito. Fatta la procedura di identificazione si è quindi pronti a produrre le proprie immagini.
Il prompting di DALL·E Ora siamo in una home page molto simile a quella di un motore di ricerca. Nella barra centrale è quindi possibile inserire la propria richiesta che darà modo all'intelligenza artificiale di acquisire le informazioni per produrre l'immagine. Essendo interfacciato con ChatGpt il sistema sembra in grado di comprendere l'italiano ma è consigliabile utilizzare l'inglese. Dopo qualche secondo il sistema riporta quattro foto. Cliccando sui tre puntini nell'angolo in alto a destra di ogni immagine spunta un menu con alcune opzioni: apri in un nuovo tab, edit immagine, genera delle variazioni, scarica e report. Ci concentriamo solo su alcune. Ovviamente apri in un nuovo tab e scarica permettono di vedere meglio il risultato oppure memorizzarla sul proprio dispositivo per i nostri utilizzi. Edit invece consente di fare alcune modifiche all'immagine. In "Edit" si possono usare alcuni strumenti per modificare la foto. Ad esempio, rimuovere lo sfondo usando l'icona della gomma o aggiungere altre immagini usando l'icona della cartolina con il simbolo "+". Quando si è soddisfatti delle modifiche, potete scaricare l'immagine cliccando sull'icona della freccia rivolta verso il basso in alto a destra o selezionando "Download" dopo aver cliccato sul pulsante "..." in alto a destra dell'immagine. Diverso è genera variazioni, in sostanza chiediamo all'Ai di proporci altre quattro immagini partendo però da una base ossia quella che più si avvicinava alla nostra idea.
Trasformare altre immagini con DALL·E Utilizzando il principio del "genera variazioni" è possibile usare l'intelligenza artificiale per modificare nostre foto. Attenzione però: non si possono usare foto di persone senza avere l'assenso di queste. Si parte dall'upload, il caricamento. Si usa il bottone in alto a destra, si apre una finestra di ricerca interna al proprio device, e si scegli l'immagine da dare in pasto all'Ai. Dopodiché ci sono tutte le opzioni di cui abbiamo già parlato. Curiosità: se poi siete a corto di idee c'è anche un tasto "surprise me" che genera una immagine a casaccio.
Il costo di DALL·E DALL·E non è completamente gratuito. Ha un sistema di crediti. Ogni mese ci sono 15 crediti a disposizione per generare appunto 15 progetti. Se invece si ha necessità di aumentare questi crediti li si possono acquistare. Al momento in cui scriviamo si tratta di 15 dollari ogni 115 crediti (pari a 460 immagini generate).
Midjourney E veniamo dunque a Midjourney, l'algoritmo di intelligenza artificiale più in voga del momento. Anche Midjourney è un text to image, genera immagini partendo appunto da irchieste testuali. La differenza sostanziale rispetto a DALL·E è nel risultato: Midjourney crea immagini originali ma meno realistiche (anche se la bravura di alcuni prompter potrebbe far cascare i meno attenti, vedi i successi dei fake del Papa, Trump e Putin). Midjourney riesce invece a creare ottime ambientazioni e soprattutto a imitare gli stili di pittori famosi. La tecnologia di Midjourney permette di realizzare immagini che non esistono nella realtà, ma che possono essere descritte con parole. E' uno strumento molto utile a chi lavora in settori creativi del design, dell'arte e della comunicazione. Ma anche in questo caso il tema etico e sociale non va sottovalutato soprattutto per quel che riguarda l'area del diritto d'autore e l'invasione della privacy. Ogni render, cioè l'elaborazione del risultato, porta via circa 50 secondi dal momento in cui parte il calcolo. Per utilizzarlo non è possibile usare un sito web come fa invece DALL·E ma bisogna invece appoggiarsi alla piattaforma Discord.
Fotogallery - Come funziona Midjourney
Registrarsi a Discord per usare Midjourney Discord è un'applicazione di chat vocale, video e testuale che consente di comunicare e socializzare con amici e comunità. Puoi creare o unirti a server organizzati in canali tematici per collaborare, condividere e parlare senza intasare una chat di gruppo. Discord è disponibile per il download su diverse piattaforme. Una volta iscritti su Discord si ha la possibilità di accedere ai canali tematici. Questo è possibile farlo su web che o scaricando l'app per Windows, Mac, Linux, Android e iPhone.
Entrare nei canali #newbie di Midjourney All'inizio si avranno a disposizione gratuitamente 25 prompt dai canali #newbie. Successivamente si possono acquistare abbonamenti (li vedremo in seguito). Su Discord ci sono dei canali #newbie dove appunto ci si può inserire per far lavorare la nostra Ai. In questi canali, che sembrano un po' da smanettoni, si lavora su una finestra di dialogo posta a piè di pagina. E' qui che si inseriscono i comandi per far lavorare Midjourney. Attenzione: qui a differenza di DALL·E si scrive solo in inglese ma soprattutto ci si trova in un ambiente pubblico, quindi tutto quello che scriverete da ora in avanti sarà visibile a tutti gli utenti connessi.
Il primo comando di Midjourney: \imagine Il primo comando da imparare è quello relativo al funzionamento di Midjourney: /imagine. Subito dopo il comando va inserita la propria richiesta testuale, una descrizione dell'immagine che vorremmo ottenere. E anche qui, più la descrizione è accurata e più il risultato potrebbe avvicinarsi ai nostri desideri. Scriviamo potrebbe perché riuscire a dialogare in modo efficiente con l'Ai, lo abbiamo già detto, è un mestiere, quindi non preoccupatevi se di fronte alle vostre richieste Midjourney restituisce una serie di mostri. Succede.
I risultati di Midjourney Una volta premuto invio fate molta attenzione, la vostra richiesta viene lanciata ma il sistema nel frattempo riceve tutte le altre richieste degli utenti presenti. Quindi dovete scorrere in alto per trovare il vostro messaggio. Per facilitarvi dovreste controllare sul lato sinistro della finestra di dialogo e cercare la linea gialla verticale. Una volta recuperato il vostro prompt, dovete aspettare che i computer elaborino le richieste precedenti alla vostra e infine otterrete il risultato. Si tratta anche in questo caso di 4 immagini proposte. A questo punto si hanno delle opzioni aggiuntive identificate dalle lettere U e V. U sta per Upscale: crea una versione più grande dell'immagine; V invece p Variazione: crea una nuova immagine basata su quella selezionata. Il numero vicino alle lettere U e V indica invece la posizione partendo da in alto a sinistra per finire in basso a destra. E infine c'è il tasto aggiorna, premendolo si otterrano quattro nuove immagini dallo stesso prompt. In ogni momento è possibile ingrandire una delle immagini e scaricarsela sul proprio device.
I comandi extra di Midjourney Midjourney è comunque uno strumento molto potente. Al comando /imagine possono essere associati diversi parametri che possono modificare le dimensioni, lo stile, la qualità, la luminosità e via dicendo. Tutti i comandi sono sempre disponibili nel sito delle documentazioni ufficiali di Midjourney.
I consigli sull'uso di Midjourney Midjourney è uno strumento divertente ma è anche complesso. Il consiglio per utilizzarlo al meglio è quello di "copiare" quello che fanno gli altri. Nei canali newbie è sempre possibile leggere i prompt di tutti. E poi cercare sui canali Youtube i tutorial dei più esperti.
Quanto costa Midjourney E torniamo al costo del servizio. Come abbiamo visto si ha la possibilità di creare 25 render. Ma una volta terminati si deve per forza iscriversi ad uno dei piano di abbonamento. Sono tre, vediamoli:
-
Basic Plan - è l'entry level costa 8 8 dollari al mese e permette di avere 200 minuti di GPU time (1 minuto è il tempo medio per una elaborazione) e consente di avere un canale privato
-
Standard Plan - saliamo a 24 dollari al mese e il tempo Gpu è di 15 ore al mese. Se però non si ha fretta questo abbonamento consente di avere immagini illimitate con la modalità "relax". Anche in questo caso si ha un canale privato dove poter lavorare fuori da occhi indiscreti.
-
Pro Plan - e infine con 48 dollari al mese si passa al piano più professional: 30 ore al mese di GPU, la modalità "relax" e la generazione di immagini in modalità privata.
E arriviamo alla conclusione. Questa breve guida, non esaustiva, permette di addentrarsi nel mondo della creatività con l'uso di strumenti di Intelligenza artificiale. Un mondo tutto da scoprire e ancora pieno di buchi normativi. Ad esempio tutte le immagini create con Ai, stando alla normativa statunitense (Paese dove risiedono le società di cui abbiamo parlato) impediscono il reclamo di copyright, in sostanza tutte le immagini possono essere usate per usi commerciali ma senza poterne reclamare il possesso. E poi c'è il discorso etico e di privacy, di cui abbiamo già parlato. Tutti sia DALL·E che Midjourney impediscono l'uso di parole a rischio (perché violente o sessuali). Ma questo non annulla i rischi di utilizzare strumenti di creatività anche per creare fake news molto più credibili.
SU TGCOM24