L’intelligenza artificiale potrebbe sostituire la fotografia?

Con la tecnologia che continua a muoversi a un ritmo rapido, ci sono state molte discussioni recenti sul fatto che i rendering digitali possano davvero sostituire la fotografia del prodotto. Facendo un ulteriore passo avanti, è possibile che un giorno l’intelligenza artificiale possa semplicemente creare immagini senza bisogno di alcun input da parte di un fotografo o di un artista digitale?

Come fotografi, spesso ci meravigliamo di quanto possa essere straordinaria la tecnologia moderna, quanto sia magica quella nuova funzione “indispensabile” della fotocamera o quanto sia diventato intelligente il software di elaborazione delle immagini. Non mi considero particolarmente vecchio, ma quando ripenso all’utilizzo di una reflex 35 mm con messa a fuoco manuale (perché era tutto ciò che dovevamo usare, non perché sono un hipster) e confronto quell’esperienza con l’incredibile rilevamento del volto o l’autofocus con rilevamento degli occhi sulle moderne fotocamere mirrorless, è difficile credere che questi enormi progressi tecnologici siano avvenuti nel corso della mia vita. Anche l’atto di stare seduto nel mio soggiorno, controllare l’illuminazione e l’intrattenimento domestico con la mia voce, o videochiamare un amico in un altro paese su un iPad sono letteralmente cose che mio figlio stesso avrebbe considerato fantascienza. Anche il mio smartphone è significativamente più potente di qualsiasi computer a cui avevo accesso prima di diventare adulto. Nel grande schema della storia umana, il tempo che ci è voluto per passare dalla prima fotocamera disponibile in commercio per il grande pubblico agli smartphone con fotocamere digitali molto efficienti nelle tasche della maggior parte delle persone nel mondo occidentale, è sorprendentemente breve.

LASTRA E mini

Questa settimana ho visto alcune immagini divertenti pubblicate sui social media da un progetto chiamato DALL·E mini. Erano immagini grezze di cose molto casuali come Joe Biden che mangia un hot dog o ragni che indossano sombrero. Le immagini stupide su Internet non sono una novità, ma si presume siano state prodotte dall’intelligenza artificiale. Alcune di queste immagini sembravano semplici disegni o cartoni animati, mentre altre sembravano render presi da un videogioco nei primi anni 2000. Nessuno era ciò che considererei realistico. La maggior parte delle immagini condivise sui social media erano piuttosto sciocche, quindi, naturalmente, volevo cercare da dove provenissero queste immagini. Una breve ricerca su Google mi ha portato a DALL·E mini. Questo modello di generazione da testo a immagine basato su Transformer è stato progettato da Boris Dayma, Suraj Patil, Pedro Cuenca, Khalid Saifullah, Tanishq Abraham, Phúc Lê, Luke, Luke Melas e Ritobrata Ghosh.

DALL·E mini è molto semplice. Si digita un breve messaggio di testo, quindi l’IA, che è stata addestrata su dati non filtrati da Internet, si mette al lavoro e produce nove immagini in base allo stimolo del testo. Queste immagini di solito variano molto l’una dall’altra, ma rappresentano l’interpretazione AI del tuo input, basata sui dati su Internet. In questo momento, non è particolarmente veloce, ci vogliono dai due ai quattro minuti per produrre immagini di qualità discutibile nella migliore delle ipotesi. Dopo aver giocato per molto più tempo di quanto avrei dovuto, posso vedere che non è altro che una miniera d’oro meme in questo momento, ma come concetto è affascinante, con eccitanti possibilità future.

Il modello è concepito per essere utilizzato per generare immagini basate su richieste di testo per la ricerca e il consumo personale. Gli usi previsti includono il supporto alla creatività, la creazione di contenuti umoristici e la fornitura di generazioni a persone curiose del comportamento del modello. Gli usi previsti escludono quelli descritti nella sezione Uso improprio e uso fuori ambito.

Vale la pena notare che queste immagini sono create da un’intelligenza artificiale, che è stata addestrata su dati non filtrati trovati su Internet, per produrre la propria interpretazione per i termini di ricerca che gli utenti le danno sotto forma di una selezione di immagini di base. Vale anche la pena considerare che le persone su Internet stanno usando la propria creatività e immaginazione nel chiedere a questa IA di creare cose per effetti comici. Se hai intenzione di guardare il forum di discussione o provare tu stesso il generatore di immagini, sii consapevole del testo di pregiudizi e limitazioni fornito dal team di sviluppo e sii consapevole del fatto che alcune persone su Internet sono degli idioti che lo troveranno divertente quando l’IA produce immagini discutibili o offensive.

Sebbene le capacità dei modelli di generazione di immagini siano impressionanti, possono anche rafforzare o esacerbare i pregiudizi della società. Sebbene l’entità e la natura dei pregiudizi del modello DALL·E mini debbano ancora essere completamente documentati, dato che il modello è stato addestrato su dati non filtrati provenienti da Internet, può generare immagini che contengono stereotipi contro i gruppi minoritari. Il lavoro per analizzare la natura e la portata di queste limitazioni è in corso.

Il futuro delle immagini generate dall’intelligenza artificiale

Probabilmente è sicuro affermare che nessun fotografo perderà presto il lavoro a causa dell’IA. Questa tecnologia, tuttavia, solleva alcune domande su come potrebbe essere il futuro dell’imaging. Ora viviamo in un mondo in cui le immagini stock sono disponibili online in pochi secondi per chiunque abbia bisogno di un’immagine generica. Certo, le immagini d’archivio sono state scattate da un professionista creativo che ne trarrà profitto, ma cosa accadrà quando l’apprendimento automatico arriverà al punto in cui alcune immagini generiche potranno essere create dall’IA? Chi possiede i diritti su quelle immagini? Questo potrebbe un giorno sostituire gran parte dell’industria delle immagini stock e nuocere ai fotografi di archivi fotografici? Potremmo un giorno vedere rendering di prodotti o luoghi prodotti interamente da un algoritmo di macchina utilizzato per scopi commerciali?

Meme e immagini sciocche a parte, volevo vedere quanto questo sistema fosse vicino alla creazione di un paesaggio realistico, quindi ho dato a DALL·E mini un semplice input di testo per vedere cosa farebbe di un bel paesaggio come input di testo. Ecco la foto che ha prodotto questa mattina. Attenti, fotografi paesaggisti! Arrivano le macchine per i tuoi lavori!

Apprezzo il fatto che, dall’aspetto delle immagini prodotte oggi, sembri una forzatura pensare che possa mai sostituire un fotografo professionista, ma 30 anni fa, un iPad e FaceTime erano roba da fantascienza, eppure ora abbiamo tutti piccoli poteri computer con fotocamere digitali ad alto megapixel in tasca ogni giorno. Le possibilità per il futuro sono eccitanti o terrificanti, a seconda del tuo punto di vista.

I rendering, che sono ancora creati da esseri umani, stanno prendendo il posto della fotografia di prodotto in alcuni luoghi. È solo questione di tempo prima che le immagini digitali siano così realistiche da non aver bisogno di fotografi reali in così tante situazioni? È possibile che un giorno non ci sarà più bisogno di fotografie commerciali?

Cosa ne pensi dei rendering o dell’IA che sostituiscono la fotografia? Questa tecnologia è eccitante o preoccupante? Quanto potrebbe essere lontano un uso commerciale legittimo di questa tecnologia? Fatemi sapere nei commenti.

Leave a Comment