Site icon Panda Security Mediacenter

Ora, ChatGPT ascolta, parla e interpreta le immagini

Ora, ChatGPT ascolta, parla e interpreta le immagini

Ora, ChatGPT ascolta, parla e interpreta le immagini

La nuova versione incorpora voce e immagini nelle conversazioni. Scopri come funziona e come potrebbe cambiare la vita delle persone!

Qualche anno fa, quando l’internet of things si affacciava sui mercati globali e prometteva grandi sconvolgimenti, la maggior parte delle persone prese queste affermazioni con le pinze, perché non c’erano ancora le infrastrutture necessarie.

Oggi, è finalmente arrivato l’anello mancante per far funzionare il nuovo mondo digitalizzato: l’intelligenza artificiale al servizio delle persone. Gli assistente virtuali o, con le parole di Google, i collaboratori creativi ora hanno molte funzionalità e l’ultima versione di ChatGPT è davvero rivoluzionaria.

L’ultimo aggiornamento di OpenAI consente al chat bot più famoso del mondo di ascoltare i prompt tramite comando vocale, rispondere in una voce a scelta e riconoscere le immagini fornite dall’utente.

Si aprono così mille scenari possibili per il futuro, tra cui alcuni più luminosi e altri più oscuri. In questo post parliamo delle novità di ChatGPT, di come funziona l’ultima versione, di chi può usarla e delle possibili conseguenze a livello di sicurezza. Continua a leggere!

Cosa fa il nuovo ChatGPT

OpenAI ha annunciato l’arrivo di un aggiornamento di ChatGPT, che interesserà sia la versione gratuita che quella a pagamento. Ecco le principali novità:

  1. ChatGPT potrà riconoscere la voce dell’utente e interpretare i prompt inseriti parlando.
  2. ChatGPT potrà rispondere e leggere le risposte in una delle 5 voci disponibili (è solo l’inizio).
  3. Viene aggiunta una funzionalità di riconoscimento delle immagini che permetterà all’utente di caricare o scattare foto da includere nelle interazioni con il chat bot.

Andiamo a vedere più da vicino in cosa consistono queste novità e come cambieranno il modo di interagire con il chat bot.


L’interazione vocale è il primo grande tassello necessario per creare un’intelligenza artificiale quasi umana, facile da usare e accessibile anche per le persone con disabilità.


ChatGPT e la voce

L’uso della voce per interagire con ChatGPT è una grandissima novità, perché consente anche ad alcune categorie di persone con disabilità di interagire con il chat bot e, inoltre, rende l’interazione più naturale, più simile all’esperienza che da sempre i creatori dell’intelligenza artificiale hanno in mente (molti hanno ricordato l’assistente personale del film Lei, con Joaquin Phoenix).

Questo è uno dei due tasselli che mancavano per creare un’AI quasi umana, che entrerà presto nelle case di tutti e, potenzialmente, potrebbe cambiare il modo di svolgere le operazioni quotidiane, dal controllare cosa c’è in frigo e suggerire una ricetta con gli ingredienti disponibili fino ad aiutare i bambini a fare i compiti.

ChatGPT e la computer vision

La capacità di un sistema informatico di vedere, ovvero di interpretare un’immagine e riconoscerne il contenuto, è il secondo tassello mancante, su cui molte Big Tech stanno sperimentando da anni con funzionalità come Google Lens.

La novità è che integrando la computer vision in ChatGPT, l’utente potrà utilizzarla per migliorare le interazioni e rivolgersi al chat bot come a un vero assistente. Guardate, ad esempio, la prova fatta in questo video pubblicato sulla pagina di Twitter di OpenAI (interazioni in inglese).

Nel video, l’utente chiede a ChatGPT di aiutarlo a regolare il sellino della bicicletta. A un certo punto, l’utente scatta una foto ravvicinata del meccanismo di chiusura del sellino e la carica nella conversazione, insieme a una foto degli utensili che ha a disposizione. Quando chiede a ChatGPT se quella è la leva per aprire e chiudere il sellino, ChatGPT risponde che non è una leva, ma è chiusa con una vite e informa l’utente che ha bisogno di una chiave a brugola per aprirla. Inoltre, riconosce l’astuccio con gli utensili e dice chiaramente all’utente che ha lo strumento di cui ha bisogno per svitare la vite e dove si trova nell’astuccio.

Le implicazioni di una conversazione di questo tipo sono tantissime. Ciò che meraviglia e apre nuovi scenari di utilizzo per il futuro è la possibilità di interagire con il chat bot in modo naturale, indicando e mostrando cose, come se avessimo di fronte una persona.

LEGGI ANCHE: 5 motivi per integrare ChatGPT nell’assistente domestico

Scenari e limiti futuri

Come abbiamo accennato all’inizio del post, è facile fare una previsione per il futuro di ChatGPT e dell’intelligenza artificiale in relazione agli utenti finali: i chat bot diventeranno degli assistenti personali (e personalizzati) sempre più utili ed efficienti.

Presto verranno integrati nella maggior parte dei compiti che svolgiamo quotidianamente, dall’uso del computer di bordo delle auto fino alle interazioni con la pubblica amministrazione o nella medicina.

Dall’altro lato, ovviamente, ChatGPT ha anche dei limiti. Si sta evolvendo molto rapidamente, per cui l’innovazione crea delle lacune da riempire che spaziano dalla privacy alla sicurezza fisica delle persone, fino alla veridicità delle informazioni.

Probabilmente, come per tutte le nuove tecnologie, nei prossimi anni il ritmo dell’innovazione di ChatGPT diminuirà, dando tempo a legislatori e sviluppatori di aggiustare il tiro e prendersi cura dei “dettagli”.


La capacità di vedere è l’altra grande rivoluzione dei chat bot, ma apre anche nuove sfide per la privacy e la sicurezza delle persone.


I rischi di sicurezza del nuovo ChatGPT

L’ultima versione è molto potente e versatile, per cui è anche più pericolosa. Ecco i principali rischi che andranno presi in considerazione e mitigati:

Questi sono solo alcuni dei possibili rischi di sicurezza, fisica e informatica, a cui ci espone il nuovo ChatGPT. Resta da vedere cosa faranno OpenAI, la concorrenza, i partner e gli organismi di regolamentazione internazionali, in primis l’Unione europea.

In questo post abbiamo visto quali sono le grandi novità dell’ultimo ChatGPT, come funziona e come potrebbe cambiare il nostro modo di vivere grazie a un’intelligenza artificiale ancora più intelligente, ora in grado di ascoltare, parlare e vedere.

CONTINUA A LEGGERE: Nuovo sondaggio, il 50% degli italiani non sa riconoscere una fake news

Buona navigazione e buona interazione con il nuovo ChatGPT!

Exit mobile version