La tecnologia che c’è dietro l’intelligenza artificiale sta facendo passi da gigante negli ultimi anni, anche se i cambiamenti più tangibili e dal grande impatto mediatico si stanno registrando solo negli ultimi mesi. In particolare, i modelli di traduzione automatica stanno diventando sempre più sofisticati e precisi.

Dopo aver annunciato AudioCraft, l’AI generativa capace di creare musica, di recente Meta, l’azienda proprietaria di Facebook, Instagram e WhatsApp, ha presentato il suo nuovo modello SeamlessM4T, in grado di tradurre e trascrivere testi e discorsi in quasi 100 lingue diverse. Ma non è l’unica novità nel campo dell’IA generativa: Meta ha anche rilasciato Code Llama, uno strumento per generare e correggere codici di programmazione. Andiamone a vedere i dettagli.

SeamlessM4T permette la traduzione multimodale fino a 100 lingue

Il nuovo modello SeamlessM4T di Meta è stato addestrato per eseguire diverse attività di traduzione multilingue e multimodale. Nello specifico, può tradurre testi e discorsi tra quasi 100 lingue diverse, oltre a poter trascrivere discorsi in testo e sintetizzare testi a voce. In precedenza per ottenere prestazioni simili erano necessari diversi modelli specializzati, con un notevole dispendio computazionale. SeamlessM4T utilizza invece un’unica architettura che garantisce traduzioni di alta qualità, soprattutto per le lingue meno diffuse.

Il modello si basa su UnitY, già utilizzato da Meta per altri compiti di traduzione multilingue. Integra inoltre componenti come BERT 2.0 per l’elaborazione audio e HiFi-GAN per la sintesi vocale. Per addestrare SeamlessM4T, Meta ha creato il dataset SeamlessAlign, contenente parallelamente testi e trascrizioni vocali per decine di miliardi di frasi in centinaia di lingue.

I test dimostrano che SeamlessM4T supera di gran lunga i modelli precedenti, risultando più robusto anche in presenza di rumori di fondo e variazioni nello stile del parlato; si tratta quindi di un passo in avanti significativo verso traduttori universali in grado di abbattere le barriere linguistiche.

Offerta

Apple MacBook Air 13" con M3 (2024)

Display Liquid Retina 13,6'', memoria unificata 16GB, archiviazione SSD 512GB, videocamera FaceTime HD 1080p, Touch ID; Galassia

1499€ invece di 1799€
-17%

Code Llama sfrutta l’IA per generare codice partendo dal testo

Ma Meta non si è fermata qui. Ha infatti presentato anche Code Llama, uno strumento di codifica automatica basato sul modello di linguaggio presentato un mese fa Llama 2, già utilizzato dall’azienda per generare testi. Code Llama è in grado di produrre codice partendo da semplici prompt, oppure completare e correggere codice scritto da programmatori umani.

Oltre alla versione base, sono state rilasciate due varianti avanzate, pensate per compiti specifici: Code Llama-Python per il linguaggio Python e Code Llama-Instrct che comprende istruzioni in linguaggio naturale. Dai test effettuati si può notare come Code Llama sembra superare altri modelli simili in benchmark specifici, e può generare codice funzionante partendo da semplici descrizioni testuali.

Si tratta di uno strumento che potrebbe aumentare l’efficienza e la produttività degli sviluppatori, anche se, allo stesso tempo, solleva interrogativi su questioni delicate come originalità e diritti d’autore del codice prodotto dall’intelligenza artificiale. Ad ogni modo, Meta ha rilasciato Code Llama in open source, permettendone l’utilizzo sia a scopo di ricerca che commerciale. La strada verso una IA davvero universale è ancora lunga, ma questi strumenti rappresentano importanti passi in avanti in tal senso.

Potrebbero interessarti anche: Windows Copilot fa progressi: ora l’IA di Windows 11 è disponibile per più utentiL’IA generativa con GPT-3.5 Turbo diventerà a misura di azienda secondo OpenAI