Ministerio de Ciencia, Innovación y Universidades. III. Otras disposiciones. Convenios. (BOE-A-2025-12053)
Resolución de 3 de junio de 2025, del Consorcio Barcelona Supercomputing Center-Centro Nacional de Supercomputación, por la que se publica el Convenio con las entidades participantes para la realización de actuaciones ligadas al desarrollo del Plan Nacional de Tecnologías del Lenguaje y del Ecosistema Empresarial de las Tecnologías del Lenguaje, en el marco de la Estrategia de Inteligencia Artificial 2024 y el Plan de Recuperación, Transformación y Resiliencia -financiado por la Unión Europea- Next Generation EU.
34 páginas totales
Página
Zahoribo únicamente muestra información pública que han sido publicada previamente por organismos oficiales de España.
Cualquier dato, sea personal o no, ya está disponible en internet y con acceso público antes de estar en Zahoribo. Si lo ves aquí primero es simple casualidad.
No ocultamos, cambiamos o tergiversamos la información, simplemente somos un altavoz organizado de los boletines oficiales de España.
Cualquier dato, sea personal o no, ya está disponible en internet y con acceso público antes de estar en Zahoribo. Si lo ves aquí primero es simple casualidad.
No ocultamos, cambiamos o tergiversamos la información, simplemente somos un altavoz organizado de los boletines oficiales de España.
BOLETÍN OFICIAL DEL ESTADO
Núm. 143
Sábado 14 de junio de 2025
Sec. III. Pág. 78503
Creación y desarrollo del modelo autosupervisado de reconocimiento del habla, tipo
wavLM (o equivalente), Ibérico.
–
–
–
–
BSC: castellano y catalán.
UPV/EHU: euskera.
USC: gallego.
CENID: valenciano.
Actividad 2.3
Un encoder fonético ibérico (para tareas de síntesis de voz).
Diseño y desarrollo de un encoder fonético ibérico necesario para tareas de síntesis
de voz, en particular para:
–
–
–
–
BSC: castellano y catalán.
UPV/EHU: euskera.
USC: gallego.
CENID: valenciano.
Actividad 2.4
Sintetizador de voz ibérico (StyleTTS2).
Diseño y desarrollo de un modelo de síntesis de voz ibérico a partir del modelo
StyleTTS2 (o equivalente) en:
–
–
–
–
BSC: castellano y catalán.
UPV/EHU: euskera.
USC: gallego.
CENID: valenciano.
Actividad 2.5 Generación modelos SLMs generativos de dominio a partir de los
modelos fundacionales.
El BSC según la actividad 2.6 coordinará y hará el seguimiento de las tareas de
desarrollo de modelos SLMs generativos (solo decoders) en diferentes dominios a partir
de los modelos fundacionales.
Diseño y desarrollo de modelos SLMs generativos (solo decoders con técnicas de
quantization o similares para reducción de tamaño) en los dominios de interés (por
ejemplo, legal y médico) a partir de los modelos fundacionales en las siguientes lenguas:
–
–
–
–
UPV/EHU: castellano y euskera.
USC: castellano y gallego.
CENID: castellano y valenciano.
UJA: castellano.
El BSC según la actividad 2.8 coordinará y hará el seguimiento de las tareas de
desarrollo de modelos discriminativos auto-encoders con arquitectura estado-del-arte en
diferentes dominios.
Diseño y desarrollo de modelos multilingües discriminativos auto-encoders con
arquitectura estado-del-arte en diferentes dominios (administrativo, científico, legal,
propiedad intelectual, médico, turístico…) para tareas discriminativas que al menos
incluya:
–
–
–
–
UPV/EHU: inglés, castellano y euskera.
USC: castellano y gallego.
CENID: inglés, castellano y valenciano.
UJA: inglés y castellano.
cve: BOE-A-2025-12053
Verificable en https://www.boe.es
Actividad 2.7 Generación de modelos discriminativos (encoders con arquitectura
deBERTA o similar) de dominio y tarea.
Núm. 143
Sábado 14 de junio de 2025
Sec. III. Pág. 78503
Creación y desarrollo del modelo autosupervisado de reconocimiento del habla, tipo
wavLM (o equivalente), Ibérico.
–
–
–
–
BSC: castellano y catalán.
UPV/EHU: euskera.
USC: gallego.
CENID: valenciano.
Actividad 2.3
Un encoder fonético ibérico (para tareas de síntesis de voz).
Diseño y desarrollo de un encoder fonético ibérico necesario para tareas de síntesis
de voz, en particular para:
–
–
–
–
BSC: castellano y catalán.
UPV/EHU: euskera.
USC: gallego.
CENID: valenciano.
Actividad 2.4
Sintetizador de voz ibérico (StyleTTS2).
Diseño y desarrollo de un modelo de síntesis de voz ibérico a partir del modelo
StyleTTS2 (o equivalente) en:
–
–
–
–
BSC: castellano y catalán.
UPV/EHU: euskera.
USC: gallego.
CENID: valenciano.
Actividad 2.5 Generación modelos SLMs generativos de dominio a partir de los
modelos fundacionales.
El BSC según la actividad 2.6 coordinará y hará el seguimiento de las tareas de
desarrollo de modelos SLMs generativos (solo decoders) en diferentes dominios a partir
de los modelos fundacionales.
Diseño y desarrollo de modelos SLMs generativos (solo decoders con técnicas de
quantization o similares para reducción de tamaño) en los dominios de interés (por
ejemplo, legal y médico) a partir de los modelos fundacionales en las siguientes lenguas:
–
–
–
–
UPV/EHU: castellano y euskera.
USC: castellano y gallego.
CENID: castellano y valenciano.
UJA: castellano.
El BSC según la actividad 2.8 coordinará y hará el seguimiento de las tareas de
desarrollo de modelos discriminativos auto-encoders con arquitectura estado-del-arte en
diferentes dominios.
Diseño y desarrollo de modelos multilingües discriminativos auto-encoders con
arquitectura estado-del-arte en diferentes dominios (administrativo, científico, legal,
propiedad intelectual, médico, turístico…) para tareas discriminativas que al menos
incluya:
–
–
–
–
UPV/EHU: inglés, castellano y euskera.
USC: castellano y gallego.
CENID: inglés, castellano y valenciano.
UJA: inglés y castellano.
cve: BOE-A-2025-12053
Verificable en https://www.boe.es
Actividad 2.7 Generación de modelos discriminativos (encoders con arquitectura
deBERTA o similar) de dominio y tarea.