A pochi giorni di distanza dal debutto dei nuovi modelli o1 e o1-mini, OpenAI ha introdotto un paio di novità: la modalità vocale avanzata e la OpenAI Academy. La prima è una nuova funzionalità che rende più naturali le voci di ChatGPT, per ora riservata agli utenti paganti e non ancora disponibile in Europa; la seconda è invece un progetto destinato a sviluppatori e organizzazioni che usano l’intelligenza artificiale provenienti da paesi a medio e basso reddito.

La modalità vocale avanzata di ChatGPT

OpenAI l’ha annunciata nella giornata di ieri, specificando che si tratta di una novità in fase di rilascio graduale inizialmente disponibile per gli utenti di ChatGPT Plus e Team, entrambi a pagamento. La modalità vocale avanzata di ChatGPT rende più umane le interazioni vocali con il chatbot, che è in grado di rispondere in maniera meno robotica, garantendo interazioni più coinvolgenti e naturali.

Sono disponibili cinque nuove voci, dei miglioramenti per gli accenti, anche relativi alla velocità e alla fluidità, c’è la funzione di memoria e le istruzioni personalizzate per la modalità vocale avanzata, novità che non sono ancora disponibili in Europa, ma che dovrebbero arrivare prossimamente (ancora non ci sono informazioni precise al riguardo, nemmeno relativamente alla disponibilità della lingua italiana).

Come visibile sui post su X di OpenAI, sarà comunque rappresentata graficamente da una sfera animata con varie tonalità di blu, modalità che, quando sarà disponibile, avviserà l’utente sull’app ChatGPT per smartphone con una notifica dedicata.

I progetti di OpenAI Academy e la traduzione di MMLU

OpenAI la descrive con un’iniziativa volta ad alimentare l’innovazione nel settore dell’intelligenza artificiale investendo in sviluppatori e organizzazioni che la sfruttano a partire dai paesi a basso e medio reddito. L’OpenAI Academy servirà a questi ultimi come strumento per risolvere problemi e come supporto per lo sviluppo economico, garantendo nel contempo che l’intelligenza artificiale sia accessibile anche per le realtà meno ricche in cui l’accesso alla formazione avanzata e alla risorse è limitato.

Fra i punti chiave del progetto OpenAI Academy vengono sottolineati la formazione e il supporto tecnico, la distribuzione di un milione di dollari in crediti API come primo fondo utile per l’IA, la promozione di una community per collaborare e condividere conoscenze e idee, oltre a progetti di collaborazione con filantropi e investitori.

“Nell’ultimo anno abbiamo potuto constatare in prima persona che investire nell’istruzione, nelle risorse e nella creazione di comunità sull’intelligenza artificiale può avere un grande impatto. Ad esempio, KOBI, il vincitore del premio OpenAI alla Tools Competition, utilizza l’IA per aiutare gli studenti con dislessia a imparare a leggere. I-Stem, uno dei vincitori del concorso turn.io Chat for Impact, utilizza l’IA per migliorare l’accesso a contenuti inaccessibili progettati per aiutare le comunità di non vedenti e ipovedenti in India a trovare un impiego. OpenAI ha fornito crediti API e indicazioni tecniche per supportare le organizzazioni vincitrici e le decine di altre che lavorano per affrontare le sfide globali” ha scritto OpenAI nel comunicato relativo in cui ha annunciato la novità, organizzazione che condividerà maggiori informazioni al riguardo, anche su come accedere alle risorse della OpenAI Academy.

Oltre all’accademia, OpenAI ha colto anche l’occasione per comunicare di aver finanziato e pubblicato la traduzione del benchmark MMLU (Massive Multitask Language Understanding), una sorta di test che permette di valutare le capacità dei modelli di linguaggio (LLM) in vari compiti diversi. Fra le quattordici nuove lingue supportate c’è anche l’italiano, lingue tradotte da persone che lavorano come traduttori di professione.

In precedenza OpenAI aveva usato il servizio Azure Translate di Microsoft per questo, strumento che garantiva livelli di precisione decisamente inferiori, a cui è subentrato un approccio che dovrebbe permettere di accedere a valutazioni dei modelli linguistici più accurate e precise e, di conseguenza, fornire un’idea più chiara di quanto sia effettivamente sfruttabile un modello di linguaggio in una determinata lingua che non sia l’inglese, usato per la maggior parte dei contenuti su cui gli LLM vengono addestrati. Maggiori dettagli al riguardo sono reperibili qui.