Skip to main content

OpenEuroLLM: l’intelligenza artificiale libera e sovrana dell’Europa

logo

Nel panorama dell’intelligenza artificiale (IA) e del linguaggio generativo, la maggior parte dei modelli di grandi dimensioni è sviluppata da grandi aziende extra-UE, spesso con licenze proprietarie, infrastrutture concentrate negli USA o in Cina, e con scarsa trasparenza sui dati, sul codice e sui criteri di addestramento. La Commissione europea e il settore pubblico/privato europeo hanno dunque percepito una duplice esigenza: rafforzare la sovranità digitale europea e promuovere modelli IA che rispecchino “valori europei” quali trasparenza, pluralismo linguistico, equità, auditabilità.
OpenEuroLLM nasce esattamente in questo contesto: una iniziativa paneuropea che punta a creare una famiglia di modelli linguistici di grandi dimensioni, aperti, multilingui e conformi agli standard dell’UE.


Cos’è OpenEuroLLM

OpenEuroLLM è un progetto europeo (finanziato tramite il programma “Digital Europe”) che coinvolge università, centri di ricerca, aziende e infrastrutture HPC in vari Paesi europei per sviluppare LLM (Large Language Models) veramente aperti — intesi come rilascio dei pesi, del codice di addestramento/test, delle pipeline di dati e valutazione, degli strumenti di anonimizzazione dei dati.
Le caratteristiche principali:

  • “Truly open”: l’obiettivo è di condividere dati, codice, modelli, metriche. 

  • Multilinguismo europeo: copertura delle lingue ufficiali UE e anche di lingue “a bassa risorsa” europee.

  • Conformità regolamentare: progettato tenendo presente il Artificial Intelligence Act dell’UE e la governance dei dati nel contesto europeo. 

  • Sovranità europea: uso delle infrastrutture HPC europee (es. consorzi EuroHPC) e riduzione della dipendenza da tecnologie non-UE. 

  • Comunità e collaborazione: coinvolgimento di startup, università, centri di supercalcolo e attori open-source in Europa.

Ad esempio, il comunicato stampa ufficiale del 3 febbraio 2025 segnala che il progetto è stato assegnatario del marchio STEP (Strategic Technologies for Europe Platform) Seal — un riconoscimento dell’UE per l’eccellenza tecnologica.


Proprietà e struttura del progetto

Obiettivi specifici

Secondo il sito ufficiale del progetto, gli obiettivi includono:

  • Sviluppare modelli di base “foundation models” per IA trasparente e performante in Europa.

  • Garantire accesso sostenibile a modelli pronti per il fine-tuning in vari domini applicativi (commerciali, pubblici). 

  • Estendere i risultati di valutazione per tutte le lingue ufficiali europee e altre lingue di interesse sociale/economico. 

  • Condividere strumenti, ricette di addestramento, pipeline di anonimizzazione e dati intermedi. 

  • Costruire una comunità attiva di sviluppatori, stakeholder pubblici e privati, che partecipino al miglioramento continuo. 

Consorzio e finanziamento

  • Il coordinatore è la Charles University (Praga, Repubblica Ceca) – istituto “Institute of Formal and Applied Linguistics”. 

  • Co-lead: Silo GenAI (Finlandia) / AMD Silo AI. 

  • Circa 20 partner europei tra università, aziende, centri HPC (es. CINECA in Italia, Barcelona Supercomputing Center in Spagna, ecc.). 

  • Budget: indicato in circa €37,4 milioni totali, di cui ~€20,6 milioni dal programma Digital Europe. 

  • Durata: circa 36 mesi (da inizio 2025). 

Caratteristiche tecniche

Pur non essendo ancora pubblico il rilascio completo dei modelli, la roadmap prevede modelli in diverse taglie (“several sizes for easy deployment”) e copertura delle lingue ufficiali UE con attenzione alle lingue “a bassa risorsa”. 
Il progetto punta ad essere «open-source in senso forte»: non solo modelli ma dati, pipeline, strumenti di valutazione. Tuttavia va osservato che alcuni analisti sottolineano che è una sfida non banale — open data + open models + competitività tecnica. 


Perché è strategico per l’Europa

Sovranità digitale

L’Europa, pur essendo forte nella ricerca e in settori specifici, ha visto una forte dipendenza da infrastrutture, modelli e piattaforme IA provenienti da USA o Cina. Creare un progetto come OpenEuroLLM significa ridurre il rischio di dipendenza tecnologica, possedere capacità autonome di IA di base, e favorire filiere locali (dati, calcolo, modelli). Il sito ufficiale lo definisce come “aligned with the imperative to improve Europe’s competitiveness and digital sovereignty”.

Lingue, cultura e pluralismo

Molti modelli “globali” LLM sono fortemente sbilanciati verso l’inglese e poche lingue maggiori. Questo fenomeno rischia di marginalizzare lingue europee meno diffuse e modelli meno sensibili alle specificità culturali/regionali. OpenEuroLLM mira a coprire tutte le lingue ufficiali UE, preservando diversità linguistica e culturale.

Contesto regolamentare e valori europei

La regolamentazione europea sull’IA (AI Act) e la governance dei dati puntano a trasparenza, equità, rispetto dei diritti fondamentali, protezione della privacy. Un modello IA che rispetta questi valori → maggiore fiducia da parte dei cittadini, delle pubbliche amministrazioni e delle imprese. OpenEuroLLM si pone esplicitamente in questo frame.

Accessibilità e competitività delle PMI

Uno dei problemi per le PMI europee è l’accesso a modelli IA grandi, con costi elevati o licenze restrittive. Un modello open, europeo, che si può fine-tuneare localmente, abbassa le soglie di ingresso all’innovazione IA. Questo dà un vantaggio competitivo agli attori europei rispetto a dipendere da soluzioni esterne.

Infrastrutture HPC europee

Addestrare LLM richiede immense risorse computazionali. L’Europa ha recentemente rafforzato infrastrutture HPC (es. EuroHPC). OpenEuroLLM usa queste infrastrutture, favorendo lo sviluppo locale invece di affidarsi interamente a cloud non-europei. 


Perché avere modelli aperti e “liberi” è importante

Trasparenza e auditabilità

Quando un modello è proprietario/black-box, è difficile per i ricercatori, per la PA o per le imprese capire cosa succede esattamente — dati di addestramento, bias, vulnerabilità, politiche di sicurezza. Un modello “vero open” consente l’audit indipendente, l’analisi di bias, la verifica da parte di comunità. OpenEuroLLM pone questo al centro. 

Libertà d’uso e adattamento

Un modello chiuso può imporre restrizioni (licenze, costi, usi vietati), impedendo che venga adattato a domini specifici (es. pubblica amministrazione, lingua minoritaria, ambiti regolamentati). Un modello libero/d’uso aperto permette a PMI, startup, università, PA di customizzare per esigenze locali.

Innovazione condivisa e comunità

Modelli open favoriscono lo sviluppo collaborativo: la comunità può contribuire dataset, strumenti, benchmark, adrenalina open source. Questo crea un ecosistema virtuoso dove non solo si riceve, ma si partecipa.

Evitare il lock-in

Con modelli proprietari c’è il rischio di “lock-in”: dipendenza da chi fornisce il modello, costi up-front, possibili revoche di licenza, vincoli. Con un modello europeo, aperto, si aumenta la libertà.

Allineamento etico e legale

Quando il modello è sviluppato con criteri aperti, è più semplice garantire che rispetti i requisiti etici/regolamentari, e che eventuali errori o bias possano essere corretti. In Europa questo è fondamentale.

Supporto delle lingue “piccole”

Le lingue europee meno diffuse spesso ricevono meno attenzione dai modelli globali: un progetto europeo aperto può colmare questo gap.

Riduzione del divario tecnologico

Le risorse per sviluppare modelli sono elevate; rendere aperte le infrastrutture e i modelli riduce la barriera d’ingresso.


Ambiti di applicazione

Ecco alcuni ambiti concreti in cui OpenEuroLLM può servire:

  • Servizi pubblici/digitalizzazione della PA: chatbot multilingue per sportelli digitali, assistenza in più lingue ufficiali UE, gestione documentale, accessibilità.

  • PMI e startup: automazione testuale, servizio clienti, generazione di contenuti multilingue, traduzione specialistica, localizzazione.

  • Ricerca universitaria e open science: dataset aperti, valutazioni, benchmarking, studio di modelli linguisticamente diversificati.

  • Industria e verticale specifiche: fine-tuning su dominio sanitario, legale, tecnico, ambientale, dove serve trasparenza/regolamentazione.

  • Educazione, linguistica e minoranze linguistiche: modelli in lingue europee minori, supporto a iniziative di istruzione e cultura, innovazione sociale.

  • Infrastrutture europee e filiere IA locali: laboratori, startup europee che vogliono sviluppare prodotto su modello open, comunità Linux/OSS che possono partecipare.


A chi si rivolge

  • Pubblica Amministrazione: perché necessitano trasparenza, conformità normativa, linguaggio multilingue, controllo sul dato.

  • PMI / Startup europee: perché vogliono usare IA senza grosse barriere di licenza, adattare al contesto locale e restare in Europa.

  • Comunità open source e ricercatori: perché devono avere accesso a modelli, dati, strumenti per studiare, migliorare, adattare.

  • Lingue e culture europee “minoritarie”: entità che vogliono avere modelli che riconoscano e servano queste lingue.

  • Sviluppatori di soluzioni IA etiche/regolate: settori (sanità, finanza, pubblica amministrazione) dove serve auditabilità, conformità.


Perché usarla - I vantaggi pratici

  • Accesso e adattabilità: modelli già addestrati ma pronti per essere fine-tuned per il proprio caso d’uso, in linguaggio europeo, senza ricominciare da zero.

  • Risparmio e minor barriera di ingresso: licenze meno restrittive, possibilità di uso on-prem o in infrastruttura europea locale, evitando cloud non europei.

  • Governance e sicurezza: maggiore controllo sul modello, sui dati usati, possibilità di audit interno.

  • Multilinguismo autentico europeo: maggiore qualità per lingue europee, non solo inglese.

  • Allineamento a valori/diritti europei: privacy, equità, trasparenza, cultural-diversity.

  • Ecosistema open & comunitario: partecipazione, contributo, beneficio collettivo, evitamento di dipendenza esclusiva da pochi vendor.

  • Sovranità tecnologica: patrimonio europeo, infrastruttura IA non affidata esclusivamente a operatori esterni.