Ministerio de Ciencia, Innovación y Universidades. III. Otras disposiciones. Convenios. (BOE-A-2025-12053)
Resolución de 3 de junio de 2025, del Consorcio Barcelona Supercomputing Center-Centro Nacional de Supercomputación, por la que se publica el Convenio con las entidades participantes para la realización de actuaciones ligadas al desarrollo del Plan Nacional de Tecnologías del Lenguaje y del Ecosistema Empresarial de las Tecnologías del Lenguaje, en el marco de la Estrategia de Inteligencia Artificial 2024 y el Plan de Recuperación, Transformación y Resiliencia -financiado por la Unión Europea- Next Generation EU.
34 páginas totales
Página
Zahoribo únicamente muestra información pública que han sido publicada previamente por organismos oficiales de España.
Cualquier dato, sea personal o no, ya está disponible en internet y con acceso público antes de estar en Zahoribo. Si lo ves aquí primero es simple casualidad.
No ocultamos, cambiamos o tergiversamos la información, simplemente somos un altavoz organizado de los boletines oficiales de España.
BOLETÍN OFICIAL DEL ESTADO
Sábado 14 de junio de 2025

Sec. III. Pág. 78501

favorecer su adopción por parte tanto de la Administración Pública como del Sector
Privado.
Adicionalmente, se persigue el desarrollo y colaboración del ecosistema investigador
de las tecnologías del lenguaje en español, para lo que se prevé la colaboración
científica y técnica de otros centros de investigación (Universidad del País Vasco-HiTZ,
Centro de Inteligencia Digital Alicante-CENID, Universidad de Santiago de Compostela y
Universidad de Jaén) y de empresas especializadas, con el Barcelona Supercomputing
Center-Centro Nacional de Supercomputación (BSC-CNS).
Plan de proyecto
Las distintas entidades participan en el proyecto cumpliendo con los objetivos y
desarrollos marcados en el plan de que se detalla en adelante. El BSC-CNS participará
en la coordinación y supervisión de las tareas llevadas a cabo en el proyecto y, por
extensión, las detalladas en este convenio. Constituirá el enlace entre las instituciones
firmantes de este convenio, informando de progresos que puedan ser de interés general,
así como coordinando las actividades que involucren a todo el ecosistema (las presentes
en este convenio). Además, asegurará la correcta realización de las tareas descritas en
este convenio transfiriendo los fondos necesarios a estas instituciones.
Los objetivos del proyecto incluyen desarrollos a nivel técnico que se especifican en
una serie de iniciativas:
1) Desarrollo de un repositorio de corpus de elevada calidad en español y lenguas
cooficiales.
2) Desarrollo de modelos de propósito general (LLM).
3) Desarrollo y puesta a disposición pública de un marco de evaluación de
modelos.
4) Actividades trasversales y desarrollo de casos de uso piloto.
5) Red territorial de equipos de colaboración técnica en IA/TL y acceso al entorno
seguro pre-comercial.
Para cada iniciativa se especifican los resultados esperados y el papel de cada
institución.
Iniciativa 1). Desarrollo de un repositorio de corpus de elevada calidad en español y
lenguas cooficiales.
– Actividad 1.1 Identificación, análisis y contacto con potenciales repositorios de
contenidos en todas las modalidades, no restrictivos y susceptibles de formar parte del
corpus general del proyecto ALIA para todas las lenguas de EspañaBSC: Coordinará y
hará el seguimiento de la actividad.
– UPV/EHU, USC, CENID y UJA: Contribuirán al entregable común.
Actividad 1.3 Operacionalización del acceso a corpus de texto para el
entrenamiento de modelos en todas las lenguas de España y Portugal. Tareas de
desarrollo de scripts/protocolos de acceso y descarga a las diferentes fuentes de datos,
publicados en github y debidamente documentados.
– BSC: Coordinará y hará el seguimiento de la actividad.
– UPV/EHU, USC, CENID y UJA: Contribuirán al entregable común.
Actividad 1.5 Operacionalización del acceso a corpus de voz para el entrenamiento
de modelos en todas las lenguas de España.
Se desarrollan los sistemas para la captura de los repositorios de datos de voz no
restrictivos y susceptibles de formar parte del corpus general de ALIA en cada uno de los

cve: BOE-A-2025-12053
Verificable en https://www.boe.es

Núm. 143