Ministerio de Ciencia, Innovación y Universidades. III. Otras disposiciones. Convenios. (BOE-A-2025-12053)
Resolución de 3 de junio de 2025, del Consorcio Barcelona Supercomputing Center-Centro Nacional de Supercomputación, por la que se publica el Convenio con las entidades participantes para la realización de actuaciones ligadas al desarrollo del Plan Nacional de Tecnologías del Lenguaje y del Ecosistema Empresarial de las Tecnologías del Lenguaje, en el marco de la Estrategia de Inteligencia Artificial 2024 y el Plan de Recuperación, Transformación y Resiliencia -financiado por la Unión Europea- Next Generation EU.
34 páginas totales
Página
Zahoribo únicamente muestra información pública que han sido publicada previamente por organismos oficiales de España.
Cualquier dato, sea personal o no, ya está disponible en internet y con acceso público antes de estar en Zahoribo. Si lo ves aquí primero es simple casualidad.
No ocultamos, cambiamos o tergiversamos la información, simplemente somos un altavoz organizado de los boletines oficiales de España.
Cualquier dato, sea personal o no, ya está disponible en internet y con acceso público antes de estar en Zahoribo. Si lo ves aquí primero es simple casualidad.
No ocultamos, cambiamos o tergiversamos la información, simplemente somos un altavoz organizado de los boletines oficiales de España.
BOLETÍN OFICIAL DEL ESTADO
Iniciativas
Sábado 14 de junio de 2025
Actividades
Fecha inicio
1.1 Identificación, análisis y
contacto con potenciales
Fecha
repositorios de contenidos
publicación en
en todas las modalidades,
el BOE.
no restrictivos y susceptibles
de formar parte del corpus.
1.3 Operacionalización del
acceso a corpus de texto
para el entrenamiento de
modelos en todas las
lenguas de España y
Portugal.
Fecha
publicación en
el BOE.
1) Desarrollo de un
repositorio de corpus
de elevada calidad
1.5 Operacionalización del
en español y
lenguas cooficiales. acceso a corpus de voz para Fecha
el entrenamiento de
publicación en
modelos en todas las
el BOE.
lenguas de España.
1.7 Pipeline de preproceso
de datos de voz.
Fecha
publicación en
el BOE.
Fecha
fin
Entidades
participantes
Sec. III. Pág. 78506
Entregables y/o resultados
M12
E1.1 Informe de actividad y acuerdos establecidos
para la cesión/compartición de datos (v1 M6; v2
BSC, UPV/EHU,
M12).
USC, UJA,
Con la contribución de UPV/EHU, USC, UJA,
CENID
CENID y la coordinación del BSC.
Responsable compilación del entregable: BSC.
M12
E1.3 Scripts/protocolos de acceso y descarga a las
diferentes fuentes de datos, publicados en github y
BSC, UPV/EHU,
debidamente documentados (v1 M6; v2 M12).
USC, UJA,
Con la contribución de UPV/EHU, USC, UJA,
CENID
CENID y la coordinación del BSC.
Responsable compilación del entregable: BSC.
M12
E1.5 Scripts/protocolos de acceso y descarga de
las diferentes fuentes de datos de voz (incluyendo
alineación texto/voz cuando sea posible),
publicados en github y debidamente documentados
BSC, UPV/EHU,
(M12).
USC, CENID
Con la contribución de todas las entidades
participantes.
Responsable compilación del entregable: UPV/
EHU.
M9
E1.7 Pipeline de preproceso de datos de voz para
todas las lenguas oficiales debidamente
documentada (v1 6M; v2 9M).
BSC, UPV/EHU,
Con la contribución de UPV/EHU, USC para el
USC
desarrollo de los componentes monolingües de
gallego y vasco. Y del BSC para el castellano.
Responsable compilación del entregable: BSC.
cve: BOE-A-2025-12053
Verificable en https://www.boe.es
Núm. 143
Iniciativas
Sábado 14 de junio de 2025
Actividades
Fecha inicio
1.1 Identificación, análisis y
contacto con potenciales
Fecha
repositorios de contenidos
publicación en
en todas las modalidades,
el BOE.
no restrictivos y susceptibles
de formar parte del corpus.
1.3 Operacionalización del
acceso a corpus de texto
para el entrenamiento de
modelos en todas las
lenguas de España y
Portugal.
Fecha
publicación en
el BOE.
1) Desarrollo de un
repositorio de corpus
de elevada calidad
1.5 Operacionalización del
en español y
lenguas cooficiales. acceso a corpus de voz para Fecha
el entrenamiento de
publicación en
modelos en todas las
el BOE.
lenguas de España.
1.7 Pipeline de preproceso
de datos de voz.
Fecha
publicación en
el BOE.
Fecha
fin
Entidades
participantes
Sec. III. Pág. 78506
Entregables y/o resultados
M12
E1.1 Informe de actividad y acuerdos establecidos
para la cesión/compartición de datos (v1 M6; v2
BSC, UPV/EHU,
M12).
USC, UJA,
Con la contribución de UPV/EHU, USC, UJA,
CENID
CENID y la coordinación del BSC.
Responsable compilación del entregable: BSC.
M12
E1.3 Scripts/protocolos de acceso y descarga a las
diferentes fuentes de datos, publicados en github y
BSC, UPV/EHU,
debidamente documentados (v1 M6; v2 M12).
USC, UJA,
Con la contribución de UPV/EHU, USC, UJA,
CENID
CENID y la coordinación del BSC.
Responsable compilación del entregable: BSC.
M12
E1.5 Scripts/protocolos de acceso y descarga de
las diferentes fuentes de datos de voz (incluyendo
alineación texto/voz cuando sea posible),
publicados en github y debidamente documentados
BSC, UPV/EHU,
(M12).
USC, CENID
Con la contribución de todas las entidades
participantes.
Responsable compilación del entregable: UPV/
EHU.
M9
E1.7 Pipeline de preproceso de datos de voz para
todas las lenguas oficiales debidamente
documentada (v1 6M; v2 9M).
BSC, UPV/EHU,
Con la contribución de UPV/EHU, USC para el
USC
desarrollo de los componentes monolingües de
gallego y vasco. Y del BSC para el castellano.
Responsable compilación del entregable: BSC.
cve: BOE-A-2025-12053
Verificable en https://www.boe.es
Núm. 143