GPT-4o mini: avanzando verso un'intelligenza conveniente

OpenAI si impegna a rendere l’intelligenza il più accessibile possibile. Oggi annunciamo GPT-4o mini, il nostro modello piccolo più conveniente. Ci aspettiamo che GPT-4o mini espanda significativamente la gamma di applicazioni basate sull’IA, rendendo l’intelligenza molto più accessibile economicamente. GPT-4o mini ottiene un punteggio dell’82% su MMLU e attualmente supera GPT-4-turbo nelle preferenze chat sulla classifica LMSYS. È disponibile a un prezzo di 15 centesimi per milione di token in input e 60 centesimi per milione di token in output, un ordine di grandezza più conveniente rispetto ai modelli di frontiera precedenti e oltre il 60% più economico di GPT-3.5 Turbo.

GPT-4o mini abilita una vasta gamma di attività grazie al suo basso costo e alla bassa latenza, come applicazioni che concatenano o parallelizzano più chiamate a modelli (ad es. API multiple), gestiscono un grande volume di contesto (ad es. interi archivi di codice o storie di conversazioni) o interagiscono con i clienti con risposte testuali rapide e in tempo reale (ad es. chatbot per l’assistenza clienti).

Attualmente, GPT-4o mini supporta testo e visione tramite API, con il supporto per testo, immagini, video e audio in entrata e in uscita previsto per il futuro. Il modello ha una finestra di contesto di 128K token, supporta fino a 16K token in output per richiesta e possiede conoscenze fino a ottobre 2023. Grazie al tokenizer migliorato condiviso con GPT-4o, la gestione del testo in lingue diverse dall’inglese è ora ancora più conveniente.

Un piccolo modello con intelligenza testuale superiore e ragionamento multimodale

GPT-4o mini supera GPT-3.5 Turbo e altri modelli piccoli nei benchmark accademici relativi sia all’intelligenza testuale che al ragionamento multimodale, supportando la stessa gamma di lingue di GPT-4o. Inoltre, mostra una forte capacità nel function calling, consentendo agli sviluppatori di creare applicazioni che recuperano dati o eseguono azioni su sistemi esterni, e un miglioramento nella gestione del contesto lungo rispetto a GPT-3.5 Turbo.

GPT-4o mini è stato valutato su diversi benchmark chiave:

Compiti di ragionamento: Ottiene l’82,0% su MMLU, un benchmark per l’intelligenza testuale e il ragionamento, rispetto al 77,9% di Gemini Flash e al 73,8% di Claude Haiku.
Matematica e programmazione: Su MGSM (ragionamento matematico), ottiene 87,0%, contro 75,5% di Gemini Flash e 71,7% di Claude Haiku. Su HumanEval (valutazione delle capacità di programmazione), ottiene 87,2%, contro 71,5% di Gemini Flash e 75,9% di Claude Haiku.
Ragionamento multimodale: Su MMMU, un benchmark per il ragionamento multimodale, ottiene 59,4%, contro 56,1% di Gemini Flash e 50,2% di Claude Haiku.

Nel processo di sviluppo, OpenAI ha collaborato con aziende come Ramp e Superhuman, che hanno riscontrato prestazioni superiori rispetto a GPT-3.5 Turbo in compiti come l’estrazione di dati strutturati da ricevute o la generazione di email di alta qualità basate sulla cronologia delle conversazioni.

Sicurezza integrata

La sicurezza è incorporata nei nostri modelli sin dalle prime fasi e rafforzata in ogni passo del processo di sviluppo. Durante la pre-addestramento, filtriamo informazioni indesiderate, come discorsi d’odio, contenuti per adulti, siti che aggregano informazioni personali e spam. Durante il post-addestramento, allineiamo il comportamento del modello ai nostri principi, utilizzando tecniche come il reinforcement learning con feedback umano (RLHF) per migliorare la precisione e l’affidabilità delle risposte.

GPT-4o mini possiede le stesse misure di sicurezza integrate di GPT-4o, che abbiamo valutato tramite test automatizzati e umani, seguendo il nostro Preparedness Framework. Più di 70 esperti esterni in settori come la psicologia sociale e la disinformazione hanno testato il modello per individuare potenziali rischi, che abbiamo affrontato e di cui condivideremo i dettagli nella scheda di sistema GPT-4o e nella Preparedness Scorecard.

Inoltre, GPT-4o mini è il primo modello a implementare il metodo di gerarchia delle istruzioni, che migliora la resistenza contro jailbreak, injection prompt e estrazione del prompt di sistema, rendendo le risposte più affidabili e sicure per applicazioni su larga scala.

Disponibilità e prezzi

GPT-4o mini è disponibile oggi come modello per testo e visione nelle API Assistants API, Chat Completions API e Batch API. Gli sviluppatori pagano 15 centesimi per milione di token in input e 60 centesimi per milione di token in output (circa l’equivalente di 2500 pagine di un libro standard). Il fine-tuning per GPT-4o mini sarà rilasciato nei prossimi giorni.

In ChatGPT, gli utenti Free, Plus e Team avranno accesso a GPT-4o mini da oggi, sostituendo GPT-3.5. Gli utenti Enterprise avranno accesso a partire dalla prossima settimana, in linea con la nostra missione di rendere l’IA accessibile a tutti.

Il futuro dell’IA

Negli ultimi anni, abbiamo assistito a progressi straordinari nell’intelligenza artificiale, accompagnati da una drastica riduzione dei costi. Ad esempio, il costo per token di GPT-4o mini è sceso del 99% rispetto a text-davinci-003, un modello meno avanzato introdotto nel 2022. Il nostro impegno è continuare a ridurre i costi migliorando al contempo le capacità dei modelli.

Immaginiamo un futuro in cui i modelli di IA siano perfettamente integrati in ogni app e sito web. GPT-4o mini sta aprendo la strada a uno sviluppo di applicazioni AI potenti, più efficienti ed economiche. L’IA del futuro sarà più accessibile, affidabile e parte integrante della nostra esperienza digitale quotidiana—e siamo entusiasti di continuare a guidare questa evoluzione.

GPT-4o mini: avanzando verso un’intelligenza conveniente

23° Press Outdoor & Promotion Key Award – Winner “Food and Beverage”, Federico Gualtieri & Luca Bergo, Tunnel Studios

23° Press Outdoor & Promotion Key Award – Winner “Consumer Promotion”, Carlo Botto Poana, Direttore Marketing (BMW) & Eleonora Macioci, Account Director (Serviceplan Italia)

23° Press Outdoor & Promotion Key Award – Winner “Media Relations & Brand Storytelling”, Jada Castagna, Project Director (Louder) & Azzurra Maiocchi, Chief Operating Officer (MSL)

23° Press Outdoor & Promotion Key Award – Winner “Media Relations & Brand Storytelling”, Andrea Bombrini, Marketing Director, The Coca-Cola Company

23° Press Outdoor & Promotion Key Award – Winner “Packaging”, Valentina Garatti, Marketing Manager (Amaro Lucano) & Sara Gaggioli, Account Executive (Arteficegroup)

Post correlati