Quando uscì CHAT-GPT siamo rimasti tutti a bocca aperta vedendo i testi che poteva creare, articoli ben fatti che utilizzavano un tono discorsivo, molto diversi dai testi schematici che ci aspettavamo da una AI, potremmo azzardare che distinguerli da un testo scitto da un umano fosse quasi impossibile.
Dobbiamo anche ricordarci che le AI sono agli inizi, hanno ancora molto da apprendere e miglioreranno probabilmente in modi che non possiamo nemmeno immaginare.
Dopo i testi abbiamo assistito a un ulteriore salto tecnologico: la possibilità di creare delle immagini semplicemente digitando un testo.
Mediante una panoramica generale su queste tecnologie proviamo a comprenderne il funzionamento, ricordandoci che potrebbero esserci delle differenze tra le varie AI che abbiamo a disposizione come DALL-E2, Midjourney, ecc.
I prompt dei comandi
Le istruzioni testuali che passiamo all'AI per generare le immagini sono chiamate 'prompt'.
In paratica è il modo con mediante il quale comunichiamo con l'AI, indicando ad esempio lo stile dell'immagine (ad esempio possiamo fare riferimento a un pittore famoso), i soggetti, lo sfondo, ecc. permetteremo all'AI di generare la nostra immagine. Inutile dire che più dati forniremo e più l'immagine sarà in linea con le nostre aspettative.
I prompt possono essere formati da una semplice riga di testo come se parlassimo con una persona reale oppure da istruzioni più elaborate. Se dovessimo indicare delle regole da seguire potremmo riassumerle così:
Evitiamo gli errori grammaticali e poniamo attenzione alla sintassi, se commettiamo errori o non siamo chiari il risultato non ci piacerà.
Ormai esistono tantissimi generatori di immagini mediante AI, vediamo i più conosciuti:
Midjourney
Uno dei più conosciuti e probabilmente più performanti attualmente disponibili, molto veloce e completo, utilizzato anche dalla rivista The Econmist per creare la copertina del numero di giugno del 2022.
Midjourney opera all'interno di Discord (una chat utilizzata prevalentemente da videogiocatori). In modo del tutto gratuito è possibile generare 25 immagini prima di dover sottoscrivere un abbonamento, esistono diversi piani tutti con prezzi contenuti.
Le immagini create sono visibili a tutti gli utenti, per renderle private occorre sottoscrivere un piano corporate.
DALL-E 2
Potentissimo e molto conosciuto poché sviluppato da Open AI, la stessa azienda che ha sviluppato CHAT-GPT, infatti utilizza l'algoritmo di apprendimento di GTP-3.
A livello di realismo è probaibilmente la scelta migliore, è molto difficile che generi risultati strani e senza senso, infatti è consderato uno dei migliori (se non il migliore) sistema per generare immagini dai testi.
Una volta iscritti verranno regalati 50 crediti da utilizzare il primo mese, dal mese successivo verranno regalati 15 crediti ogni mese, se non ne facciamo un uso quotidiano per lavoro potremmo farcela senza alcun costo.
Infine grazie alla funzione 'pennello' ci consente di aggiungere dettagli aggiuntivi come luci e ombre.
Jasper Art
Anche questo considerato uno dei migliori rientra nell'olimpo dei più completi e performanti, di recente pubblicazione ha guadagnato fin da subito molta popolarità.
Può creare immagini e opere d'arte in diversi stili, molto veloce nella realizzazione è in grado di creare immagini anche da pochissime istruzioni testuali. Purtroppo non offre nessun piano di prova e ha un costo mensile di $ 20.
Nightcafe
Nightcafe consente di scegliere tra diversi algoritmi, una volta scelto l'algoritmo dobbiamo scegliere lo stile artistico e la risoluzione e siamo pronti a creare la prima immagine, senza nemmeno dover creare un account. infatti Nightcafe permette di partire immediatamente senza nemmeno un account con 5 crediti di prova.
Oltre alle immagini è in grado di creare anche video artistici.
Come si addestra l'AI e i problemi di copyright
Come abbiamo fatto ad insegnare all'AI a creare delle immagini in base alle istruzioni che gli inviamo? Semplice, abbiamo caricato miliardi di immagini prese ovunque in modo che potesse imparare tutto sulle immagini, dagli stili alle luci, dai colori ai soggetti.
Tuttavia questo insegnamento senza regole ha incluso anche tantissime immagini protette da copyright che l'AI utilizza per crearne di nuove, spesso introducendo particolari tipici di un'immagine che non si potrebbe riutilizzare. inutile dire che è scoppiata una polemica ma è anche inutile dire che tutto andrà avanti e che questo processo è inarrestabile.
Conclusione
Con le Ai il mondo si è diviso in due fazioni, dagli entusiasti del loro ingresso nelle nostre vite convinti che ci aiuteranno in numerosi ambiti della nostra vita a chi le teme, o perché convinti che distruggeranno il mondo in stile Teerminator o più semplicemente che ci porteranno via il lavoro.
Se dovessi dare la mia opinione io starei nel mezzo, ovvero le opportunità che offrono sono tantissime e tutte molto affascinanti, non credo distruggeranno il mondo ma sono certo che faranno saltare tanti posti di lavoro aprendo però le porte ad altre professioni, ricordiamoci che quando arrivarono i primi computer si pensava che avrebbero soppiantato diversi lavori, poi si è creato il lavoro dell'informatico che a livello di numeri probabilmente ha superato il numero di impiegati che sono rimasti a casa, come sempre si tratta di adattarsi ed evolversi per non restare indietro.
Potrebbe interessarti anche
Chi siamo
Siamo un'agenzia web attiva dal 1999, ci occupiamo di comunicazione, sviluppo siti web, grafica e immagine coordinata, richiedi un preventivo gratuito.