Ministerio de Ciencia, Innovación y Universidades. III. Otras disposiciones. Convenios. (BOE-A-2025-12053)
Resolución de 3 de junio de 2025, del Consorcio Barcelona Supercomputing Center-Centro Nacional de Supercomputación, por la que se publica el Convenio con las entidades participantes para la realización de actuaciones ligadas al desarrollo del Plan Nacional de Tecnologías del Lenguaje y del Ecosistema Empresarial de las Tecnologías del Lenguaje, en el marco de la Estrategia de Inteligencia Artificial 2024 y el Plan de Recuperación, Transformación y Resiliencia -financiado por la Unión Europea- Next Generation EU.
34 páginas totales
Página
Zahoribo únicamente muestra información pública que han sido publicada previamente por organismos oficiales de España.
Cualquier dato, sea personal o no, ya está disponible en internet y con acceso público antes de estar en Zahoribo. Si lo ves aquí primero es simple casualidad.
No ocultamos, cambiamos o tergiversamos la información, simplemente somos un altavoz organizado de los boletines oficiales de España.
Cualquier dato, sea personal o no, ya está disponible en internet y con acceso público antes de estar en Zahoribo. Si lo ves aquí primero es simple casualidad.
No ocultamos, cambiamos o tergiversamos la información, simplemente somos un altavoz organizado de los boletines oficiales de España.
BOLETÍN OFICIAL DEL ESTADO
Iniciativas
Sábado 14 de junio de 2025
Actividades
Fecha inicio
1.8 Dataset de alineamiento.
Los datos de alineamiento
Fecha
son la última fase después
publicación en
de los datos de preel BOE.
entrenamiento y de
instrucción
1) Desarrollo de un
repositorio de corpus
de elevada calidad
en español y
lenguas cooficiales.
1.9 Generación de datos
(sintéticos) para corpus
paralelos (Traducción
Automática) incluyendo
adaptación a dominio.
1.10 Generación de corpus
de dominio (legal,
médico,...).
Fecha
publicación en
el BOE.
Fecha
publicación en
el BOE.
Fecha
fin
Entidades
participantes
Sec. III. Pág. 78507
Entregables y/o resultados
M11
E1.8 Corpus de alineamiento de modelos en todas
BSC, UPV/EHU, las lenguas de España (M11).
USC, UJA,
Con la contribución de todas las entidades
participantes.
CENID
Responsable compilación del entregable: UJA.
M12
E1.9.1 BSC: Corpus paralelos inglés, castellano,
catalán, chino para entrenamiento de modelos de
TA (v1 M6; v2 M12).
E1.9.2 UPV/EHU: Corpus paralelos inglés,
castellano y euskera para entrenamiento de
modelos de TA (v1 M6; v2 M12).
BSC, UPV/EHU,
E1.9.3 USC Corpus paralelos inglés, castellano y
USC, UJA,
gallego para entrenamiento de modelos de TA (v1
CENID
M6; v2 M12).
E1.9.4 UJA Corpus paralelos inglés, y castellano
para entrenamiento de modelos de TA (v1 M6; v2
M12).
E1.9.5 CENID Corpus paralelos inglés, castellano y
valenciano (v1 M6; v2 M12).
M12
E1.10.1 BSC: Corpus de dominio: jurídico/legal
y científico en castellano; procesado y debidamente
metadatos (V1 M6; v2 M12).
E1.10.2 UPV/EHU: Corpus de dominio de noticias,
legal/administrativo y científico procesado y con sus
correspondientes metadatos (V1 M6; v2 M12).
BSC, UPV/EHU, E1.10.3 USC: Corpus de dominio de noticias,
USC, UJA,
cultura y legal/administrativo (V1 M6; v2 M12).
CENID
E1.10.4 UJA: Corpus de dominio legaladministrativo, patrimonio-cultural y biosanitario
procesado y con sus correspondientes metadatos.
(V1 M6; v2 M12).
E1.10.5 CENID: Corpus de dominio turístico y de la
propiedad intelectual procesado y con sus
correspondientes metadatos (V1 M6; v2 M12).
cve: BOE-A-2025-12053
Verificable en https://www.boe.es
Núm. 143
Iniciativas
Sábado 14 de junio de 2025
Actividades
Fecha inicio
1.8 Dataset de alineamiento.
Los datos de alineamiento
Fecha
son la última fase después
publicación en
de los datos de preel BOE.
entrenamiento y de
instrucción
1) Desarrollo de un
repositorio de corpus
de elevada calidad
en español y
lenguas cooficiales.
1.9 Generación de datos
(sintéticos) para corpus
paralelos (Traducción
Automática) incluyendo
adaptación a dominio.
1.10 Generación de corpus
de dominio (legal,
médico,...).
Fecha
publicación en
el BOE.
Fecha
publicación en
el BOE.
Fecha
fin
Entidades
participantes
Sec. III. Pág. 78507
Entregables y/o resultados
M11
E1.8 Corpus de alineamiento de modelos en todas
BSC, UPV/EHU, las lenguas de España (M11).
USC, UJA,
Con la contribución de todas las entidades
participantes.
CENID
Responsable compilación del entregable: UJA.
M12
E1.9.1 BSC: Corpus paralelos inglés, castellano,
catalán, chino para entrenamiento de modelos de
TA (v1 M6; v2 M12).
E1.9.2 UPV/EHU: Corpus paralelos inglés,
castellano y euskera para entrenamiento de
modelos de TA (v1 M6; v2 M12).
BSC, UPV/EHU,
E1.9.3 USC Corpus paralelos inglés, castellano y
USC, UJA,
gallego para entrenamiento de modelos de TA (v1
CENID
M6; v2 M12).
E1.9.4 UJA Corpus paralelos inglés, y castellano
para entrenamiento de modelos de TA (v1 M6; v2
M12).
E1.9.5 CENID Corpus paralelos inglés, castellano y
valenciano (v1 M6; v2 M12).
M12
E1.10.1 BSC: Corpus de dominio: jurídico/legal
y científico en castellano; procesado y debidamente
metadatos (V1 M6; v2 M12).
E1.10.2 UPV/EHU: Corpus de dominio de noticias,
legal/administrativo y científico procesado y con sus
correspondientes metadatos (V1 M6; v2 M12).
BSC, UPV/EHU, E1.10.3 USC: Corpus de dominio de noticias,
USC, UJA,
cultura y legal/administrativo (V1 M6; v2 M12).
CENID
E1.10.4 UJA: Corpus de dominio legaladministrativo, patrimonio-cultural y biosanitario
procesado y con sus correspondientes metadatos.
(V1 M6; v2 M12).
E1.10.5 CENID: Corpus de dominio turístico y de la
propiedad intelectual procesado y con sus
correspondientes metadatos (V1 M6; v2 M12).
cve: BOE-A-2025-12053
Verificable en https://www.boe.es
Núm. 143