Ministerio de Ciencia, Innovación y Universidades. III. Otras disposiciones. Convenios. (BOE-A-2025-12053)
Resolución de 3 de junio de 2025, del Consorcio Barcelona Supercomputing Center-Centro Nacional de Supercomputación, por la que se publica el Convenio con las entidades participantes para la realización de actuaciones ligadas al desarrollo del Plan Nacional de Tecnologías del Lenguaje y del Ecosistema Empresarial de las Tecnologías del Lenguaje, en el marco de la Estrategia de Inteligencia Artificial 2024 y el Plan de Recuperación, Transformación y Resiliencia -financiado por la Unión Europea- Next Generation EU.
34 páginas totales
Página
Zahoribo únicamente muestra información pública que han sido publicada previamente por organismos oficiales de España.
Cualquier dato, sea personal o no, ya está disponible en internet y con acceso público antes de estar en Zahoribo. Si lo ves aquí primero es simple casualidad.
No ocultamos, cambiamos o tergiversamos la información, simplemente somos un altavoz organizado de los boletines oficiales de España.
BOLETÍN OFICIAL DEL ESTADO

Iniciativas

Sábado 14 de junio de 2025

Actividades

Fecha inicio

2.2 Modelo autosupervisado
Fecha
de voz tipo wavLM (o
publicación en
equivalente) Ibérico en
el BOE.
mínimo 4 idiomas.

2.3 Un encoder fonético
ibérico (para tareas de
síntesis de voz).

2.4 Sintetizador de voz
ibérico (StyleTTS2)

2) Desarrollo de
modelos de
propósito general
(LLM).

2.5 Generación modelos
SLMs generativos de
dominio y/o lengua a partir
de los modelos
fundacionales

Fecha
publicación en
el BOE.

Fecha
publicación en
el BOE.

Fecha
publicación en
el BOE.

2.7 Generación de modelos
discriminativos (encoders
Fecha
con arquitectura deBERTA o publicación en
el BOE.
equivalente) de dominio y
tarea.

2.9 Generación de datasets
para tareas discriminativas

Fecha
publicación en
el BOE.

Fecha
fin

Entidades
participantes

Sec. III. Pág. 78508

Entregables y/o resultados

M12

E2.2 Modelo autosupervisado de voz tipo wavLM (o
equivalente) Ibérico (v1 M6; v2 M12).
BSC, UPV/EHU, Entrenado en MN5 por el BSC con la aportación de
USC, CENID datos de UPV/EHU, USC y CENID en las
respectivas lenguas.
Responsable del entregable: BSC.

M6

E2.3.1 BSC: Encoder fonético para el castellano
(M6).
E2.3.2 USC: Encoder fonético para el gallego (M6).
BSC, UPV/EHU,
E2.3.3 UPV/EHU Encoder fonético para el euskera
USC, CENID
(M6).
E2.3.4 CENID Encoder fonético para la variedad
valenciana (M6).

M9

E2.4.1 BSC: Sintetizador de voz ibérico
(StyleTTS2) para el castellano y catalán (M9).
E2.4.2 USC: Sintetizador de voz ibérico
BSC, UPV/EHU, (StyleTTS2) para el gallego (M9).
USC, CENID E2.4.3 UPV/EHU: Sintetizador de voz ibérico
(StyleTTS2) para el euskera (M9).
E2.4.4 CENID: Sintetizador de voz ibérico
(StyleTTS2) para la variedad valenciana (M9).

M12

E2.5.1 UPV/EHU: Modelos SLMs generativos de
dominio y/o lengua a partir de los modelos
fundacionales (v1 M9; v2 M12).
E2.5.2 USC: Modelos SLMs generativos de
dominio y/o lengua a partir de los modelos
BSC, UPV/EHU, fundacionales (v1 M9; v2 M12).
USC, UJA,
E2.5.3 UJA: Modelos SLMs generativos de dominio
CENID
a partir de los modelos fundacionales (v1 M9; v2
M12).
E2.5.4 CENID: Modelos SLMs generativos de
dominio y/o lengua a partir de los modelos
fundacionales (v1 M9; v2 M12).
Coordinación de la actividad: BSC.

M12

E2.7.1 UPV/EHU: Modelos discriminativos
adaptados a cada dominio y/o tarea (v1 M6, v2
M12).
E2.7.2 USC: Modelos discriminativos adaptados a
BSC, UPV/EHU,
dominio y/o tarea (v1 M6, v2 M12).
USC, UJA,
E2.7.3 UJA: Modelos discriminativos adaptados a
CENID
dominio y/o tarea (v1 M6, v2 M12).
E2.7.4 CENID:Modelos discriminativos adaptados a
dominio y/o tarea (v1 M6, v2 M12).
Coordinación de la actividad: UJA.

M9

E2.9.1 BSC: al menos tres dataset para tareas
discriminativas de impacto (M9).
E2.9.2 UPV/EHU: al menos tres dataset para tareas
discriminativas de impacto (M9).
E2.9.3 USC: al menos tres dataset para tareas
discriminativas de impacto (M9).
BSC, UPV/EHU, E2.9.4 UJA: al menos tres dataset para tareas
USC, UJA,
discriminativas de impacto: por ejemplo: detección
CENID
lenguaje ofensivo, detección de trastornos
mentales, tratamiento de subjetividad (M9).
E2.9.5 CENID: al menos tres dataset para tareas
discriminativas de impacto, tales como detección de
fraude, detección de marcas falsas y detección de
lenguaje claro (M9).
Coordinación de la actividad: UJA.

cve: BOE-A-2025-12053
Verificable en https://www.boe.es

Núm. 143