top of page

CASO STUDIO AI WEB: DALL-E vs DREAM GENERATOR vs BING IMAGE

Confrontiamo i vari risultati generati da tre diverse intelligenze artificiali: DALL-E, Dream Generator e Bing Image.


Nel mondo in continua evoluzione dell'Intelligenza Artificiale (IA), l'arte della generazione di immagini ha raggiunto nuove vette di creatività e potenza. Tre tra le IA più interessanti in questo ambito sono DALL-E, Dream Generator e Bing Image. Ognuna di queste intelligenze artificiali è stata progettata con l'obiettivo di creare immagini straordinarie e sorprendenti, ma le loro metodologie e approcci sono differenti. In questo articolo, esploreremo le differenze e le similitudini tra le immagini generate dalle tre intelligenze artificiali. Abbiamo posto una sfida specifica a ciascuna di queste IA: generare un'immagine realistica del box Ferrari di Formula 1. La richiesta comprendeva la visione laterale di una macchina con il pilota a bordo, visibile senza il casco, circondato da alcuni meccanici. L'obiettivo era ottenere un'immagine che apparisse quanto più realistica possibile.


DALL-E delude: le immagini proposte sono di pessima qualità



Abbiamo chiesto a DALL-E, l’algoritmo di intelligenza artificiale capace di generare immagini a partire da descrizioni testuali sviluppato da OpenAI, di creare varie immagini, partendo dalla foto che gli abbiamo proposto (quella con la scritta original). Nella prima richiesta, oltre all’immagine, gli abbiamo anche specificato che volevamo un’immagine del box della Ferrari di Formula 1, con qualche meccanico, specificando inoltre di non cambiare la faccia del pilota e i loghi della macchina. Ecco, come potete vedere, al primo tentativo DALL-E non ha capito niente. Ha creato degli strani disegni della Ferrari facendo sparire il pilota e cambiando i loghi della macchina, probabilmente per questione di copyright. Quando invece gli abbiamo chiesto delle alternative, sempre partendo dalla foto originale, ha fatto leggermente meglio, anche se in una foto ha messo una sorta di mascherina nera a coprire il volto del pilota senza motivo. Anche in questo caso, i loghi della macchina sono stati sostituiti. Per spezzare una lancia a favore di DALL-E, possiamo anticipare che anche le altre due intelligenze artificiali di cui parleremo in questo articolo hanno modificato i loghi, chi più chi meno. In ogni caso, i risultati forniti da DALL-E sono molto deludenti.


Dream Generator meglio di DALL-E, ma comunque non accettabile




Passiamo alla seconda intelligenza artificiale che abbiamo provato: Dream Generator. Anche qui abbiamo aggiunto la nostra immagine di partenza, oltre allo stesso prompt usato su DALL-E in precedenza. Anche in questo caso, l’intelligenza artificiale non ascolta le nostre richieste. In due foto cambia completamente l’immagine del pilota e modifica (anche se solo leggermente rispetto a DALL-E) lo stemma. La terza foto proposta è completamente fuori dalla richiesta, visto che il pilota sparisce e cambia completamente anche lo stile della macchina. Guardando meglio però, si può notare come nella prima foto il braccio alla destra del pilota sparisce, rispetto alla foto originale. Inoltre, compare una piccola mano sulla sinistra del pilota, all’altezza del logo e la presa dell’altra mano è stata modificata in modo innaturale. Nella seconda foto invece, possiamo come viene aggiunto un terzo braccio sulla destra del pilota. I risultati proposti, quindi, non sono stati all’altezza della richiesta, ma comunque leggermente meglio di quelli di DALL-E.



Le proposte di Bing Image

L’ultima intelligenza artificiale che abbiamo deciso di provare è stata Bing Image. Qui non avevamo la possibilità di caricare l’immagine di partenza; quindi, abbiamo dovuto variare il prompt, visto che Bing avrebbe dovuto creare l’immagine da zero. Gli abbiamo chiesto di creare una foto del box Ferrari di Formula 1, dove si vede il pilota senza casco dentro alla macchina vista di lato, con attorno alcuni meccanici, richiedendo anche che l'immagine generata sia realistica.

Il primo risultato proposto non è male, anche se il pilota ha il casco, per il resto la richiesta è stata abbastanza soddisfatta.

Nella seconda foto proposta invece, oltre al pilota con il casco, i meccanici sembrano fatti un po’ male. Quello a sinistra della foto, infatti, sembra così vicino alla ruota dietro della macchina da avergli fatto sparire una delle due gambe. L’altro meccanico invece, sembra avere la gamba destra messa a un’altezza diversa rispetto alla sinistra. A parte questi piccoli dettagli, anche la seconda foto è discreta.

Infine, esaminiamo la terza e ultima foto che ci ha proposto Bing Image. L’immagine proposta è molto bella. Oltre al solito casco che sembra impossibile da togliere al pilota, l’unico altro piccolo difetto è la silhouette troppo magra dei due meccanici sulla destra. Per il resto si può dire che la richiesta è stata soddisfatta. In base alle immagini proposte delle tre intelligenze artificiali, possiamo dire che Bing Image ha vinto la sfida, anche se le richieste non sono state pienamente soddisfatte, il risultato proposto è stato il migliore, rispetto a quelli di DALL-E e Dream Generator.



Comments


bottom of page