Alessandro Bersanetti - A proposito di IA...

Alessandro Bersanetti – A proposito di IA…

L’intelligenza artificiale (IA o AI se vogliamo usare l’acronimo inglese) è un campo di ricerca che si occupa di sviluppare algoritmi e tecnologie in grado di imitare o superare la capacità umana di apprendere, elaborare informazioni e prendere decisioni. Grazie alle recenti innovazioni tecnologiche, l’IA sta diventando sempre più diffusa in molti settori, inclusi quelli artistici e creativi.

Nel campo artistico, l’IA viene utilizzata per creare opere d’arte e per aiutare gli artisti a sviluppare nuove idee. Una delle applicazioni più note dell’IA nel settore, è la generazione di immagini tramite la cosiddetta “rete neurale generativa” (GAN), una tecnologia che utilizza algoritmi per generare immagini. Le GAN possono essere utilizzate per creare opere d’arte digitali, ma anche per creare immagini di oggetti e ambienti che possono essere utilizzati in progetti di animazione e videogiochi.

Inoltre, l’IA viene utilizzata anche nel campo dell’illustrazione e della fotografia. Grazie alle sue capacità di apprendimento automatico e di analisi dei dati, l’IA può essere utilizzata per migliorare la qualità delle immagini e delle foto. Recentemente sul noto programma di ritocco Photoshop, sono state integrate nuove funzioni che usano algoritmi di IA i quali permettono di ricreare porzioni di immagini, cancellarne altre ricreando uno sfondo coerente, trasformare un’immagine sfuocata mettendola perfettamente a fuoco facendo addirittura un upscaling, aumentandone la risoluzione, pur mantenendo perfettamente nitidi tutti i particolari. A differenza di ciò che succedeva prima che fosse implementata questa tecnologia, aumentando la risoluzione di un’immagine, si aumentavano semplicemente i pixel adiacenti, rendendo l’immagine sì più alta in numero di pixel, ma anche più sfuocata se la si visualizzava alla massima risoluzione. Ora invece, l’IA interpreta l’immagine e ricostruisce i pixel mancanti andando a crearne di nuovi perfettamente coerenti con l’immagine di partenza. Naturalmente non solo Adobe sta applicando questa tecnologia ai propri prodotti, ma anche tutti i colossi informatici, come Google, Microsoft, Nvidia, Apple ecc.

L’IA può anche essere utilizzata per creare nuove forme di arte digitale, come l’arte generativa. L’arte generativa utilizza l’IA per creare opere d’arte in modo automatico, senza l’intervento umano se non l’inserimento di una o più righe di testo. Questo tipo di arte è diventato sempre più popolare negli ultimi mesi, con autori che utilizzano l’IA per creare immagini uniche e sorprendenti.
Per creare un’immagine, di solito con effetti stupefacenti per la qualità e la creatività, è sufficiente scrivere un prompt testuale (tradotto: richiesta-suggerimento) nel quale si descrive ciò che si vorrebbe che l’IA realizzasse. Possiamo definire le proporzioni dell’immagine, quadrata, verticale, orizzontale, che tipo di tecnica vogliamo utilizzare, fotografica, acquerello, dipinto a olio, schizzo, carboncino, possiamo perfino decidere di imitare tecniche usate da pittori o illustratori famosi, basta inserire i loro nomi nel prompt. Le opportunità sono effettivamente infinite e l’autore deve dare solo sfogo alla propria fantasia. Detto così sembra semplicissimo, ma in realtà non è proprio così. Spesso il processo si rivela frustante se si vuole raggiungere l’obiettivo preciso che ci si è prefissati.  Questi algoritmi sono stati programmati per “imparare” per cui oltre a mettere in atto le informazioni di cui già dispongono, assimilano anche le informazioni che l’utente inserisce nel prompt. Ne deriva dunque una complessa serie di elaborazioni vincolate da ciò che si scrive e da ciò che già l’algoritmo ha implementato. Tutta questa serie di calcoli estremamente complessi, vengono realizzato a monte da una rete di servers, enormemente più potenti dei nostri PC, che in pochi secondi ci visualizzano ciò che ha interpretato l’IA dai nostri comandi.
Ci sono vari programmi che ci permettono di realizzare immagini inserendo un testo, detti appunto “text to image”: Dall-E, Stable Diffusion, Leonardo AI, Blue Willow, Midjourney tanto per citare i più conosciuti, ognuno con i propri punti di forza. Personalmente tra tutti preferisco Midjourney (www.midjourney.com) a cui si accede tramite I’applicazione di messaggistica Discord, come per Blue Willow e Leonardo.AI. Mentre Leonardo.AI e Blu Willow sono al momento gratuiti, Midjourney è solo a pagamento. Oltre alle chiare istruzioni sul suo utilizzo all’interno del programma, esistono innumerevoli tutorials e supporto online con una pagina Facebook anche italiana, per ottenere il meglio dal programma. Questo all’inizio permetteva un periodo di prova limitato ad un numero di immagini, dopo di che si doveva passare ad un servizio a pagamento mensile con varie opzioni. Ora, visto il numero enorme di utenti richiedenti il periodo di prova gratuito, hanno deciso di non renderlo più disponibile per dare maggior spazio sui server agli utenti paganti. Sono disponibili 3 tipologie di abbonamento: Base, Standard e Pro, rispettivamente a 10, 30, 60 euro mensili (più IVA)  Ciò che genera, anche con delle indicazioni ridotte al minimo, è davvero stupefacente, e per i test che ho fatto, si posiziona una spanna sopra la concorrenza e i 10 euro dell’abbonamento Base, li vale tutti. Midjourney, come pure gli altri programmi di questo genere, hanno ancora dei punti di debolezza che sicuramente in un futuro molto vicino, verranno risolti. Questi programmi, non hanno la capacità di “creare” immagini dal nulla, ma in sostanza elaborano una mole immensa di dati e di immagini a cui hanno accesso, estrapolandone porzioni che poi riassemblano, seguendo la logica dei prompt che gli vengono sottoposti. In sostanza per semplificare il principio, fanno una sorta di “collage” di tutto ciò che occorre per rendere l’immagine il più vicino possibile alla richiesta, aggiungendo sfumature, ombre, riflessi, effetti, filtri rielaborando e fondendo alla perfezione stili già esistenti. Purtroppo questo collage, non di rado, realizza immagini assolutamente non utilizzabili, creando personaggi con braccia, dita e gambe multiple o al contrario con arti mancanti. Altro punto di debolezza, è l’incapacità di realizzare precise repliche di mezzi di trasporto, come aerei, auto, moto ecc. Esempio, ho tentato di realizzare un immagine con l’aereo Enola Gay, ma non sono mai riuscito ad ottenere lo stesso modello di aereo, a volte lo faceva bimotore, a volte solo tre motori con ali asimmetriche, altre volte di dimensioni non realistiche rispetto le proporzioni con l’equipaggio.
Altra cosa che ha difficoltà a realizzare, sono 2 o più personaggi che interagiscono tra loro, se ad esempio scrivi un prompt dove vuoi realizzare un combattimento tra Bruce Lee ed un altro personaggio, l’immagine che ne esce è quella di 2 che si fronteggiano senza una vera coerenza, quasi fossero ritagliate da due fonti diverse ed incollate tra loro. Quando si danno poche indicazioni nei prompt, si ottengono le immagini più artistiche e sbalorditive, anche se con meno controllo, di quelle realizzate inserendo innumerevoli informazioni. Ci sarebbe da scrivere pagine su pagine sulle possibilità artistiche offerte da questi programmi, che se la cavano egregiamente anche nella realizzazione di textures e moduli seamless, cioè immagini che accostate tra loro, compongono un multiplo senza che si vedano linee di unione, ideali nella stampa dei tessuti o carta da parati, per dare un esempio.

Opinione personale, sono convinto che l’IA, con la continua e rapidissima evoluzione sarà sempre più presente nella vita quotidiana e non solo nel campo artistico, al punto da non poterne fare più a meno, come è stato per internet e per i cellulari. I programmi che usano questa tecnologia, semplificano il lavoro e di conseguenza la vita, permettendo di essere più produttivi. Temere questa tecnologia e volerla demonizzare, è un po’ la stessa reazione avvenuta con il sabotaggio dei macchinari durante la rivoluzione industriale all’inizio del del XIX secolo, in quanto considerati una minaccia dai lavoratori, perché causa dei bassi stipendi e della disoccupazione. Che qualche figura lavorativa possa venirne danneggiata è possibile, ma è anche vero che si possono aprire nuove possibilità per chi invece riesce a padroneggiare queste nuove tecnologie. Io non credo che si possa sostituire un illustratore un pittore o un musicista, gli artisti per definizione, sono coloro che con le loro opere riescono a trasmettere emozioni. Per quanto sia evoluta la tecnologia che crea immagini o musica, dietro ad ogni elaborazione di calcoli, per quanto complessi, c’è sempre l’input di un essere umano, di cui il computer è un semplice strumento. Prima dell’avvento dei computer si dipingeva con pennelli, carboncini, matite, ora si può dipingere con una tavoletta grafica, ma non per questo chi crea immagini è meno artista, anche se ciò che crea è sostanzialmente intangibile, ma un insieme di pixel. Allo stesso modo chi, in un futuro prossimo, con l’aiuto dell’IA, creerà contenuti, immagini, musica o video che rispecchino esattamente ciò che sente e che vuole trasmettere al pubblico, a mio parere, è da considerarsi comunque un artista.

Se poi malauguratamente, l’IA arrivasse davvero a svilupparsi al punto tale da divenire entità senziente, in grado di ragionare autonomamente e provare emozioni umane, allora saremmo di fronte a qualcosa di completamente diverso e gli sviluppi diverrebbero imprevedibili, con il rischio di inversione dei ruoli uomo-macchina.
Ma per il momento questo rimane ancora fantascienza.

Alessandro Bersanetti

Alcuni esempi di prompt
STILE INCISIONE 1400

disco inferno horror and creepy mood, view from an elevated position, people
masquerading as demons dancing madly and shaking in a square, smoke,
flames in the background,high detailed antique sketch hand drawing 1400s
style –ar 2:3 –s 1000 –v 5.1 –q 2

STILE DIPINTO ANTICO
disco inferno horror and creepy mood, view from an elevated position, people
masquerading as demons dancing madly and shaking in a square, smoke,
flames and strobe lights in the background, cinematic lights, high detailed
antique medieval oil paint style –ar 2:3 –s 1000 –v 5.1 –q 2

STILE FOTOGRAFICO
disco inferno from 70s, people dancing at music rithm, cinematic lights, high
detailed realistic photo style –ar 2:3 –s 1000 –v 5.1 –q 2

STILE ACQUERELLO
disco inferno horror and creepy mood, view from an elevated position,
people masquerading as demons dancing madly and shaking in a church
discotheque, smoke, flames and strobe lights in the background, cinematic
lights, high detailed watercolor paint style –ar 2:3 –s 1000 –v 5.1 –q 2