La Universitat de València participa en un proyecto para reunir 300 millones de palabras y formas de la lengua española
José Manuel Blecua, director de la Real Academia Española (RAE), y Emilio Botín, presidente de Banco Santander, han suscrito esta semana un convenio que renueva la colaboración entre ambas entidades, iniciada en 2007, y que se mantendrá hasta 2014. Con el acuerdo, el banco a través de su División Global Santander Universidades, aportará 700.000 euros para proyectos de la RAE, entre los que destaca la culminación del Corpus del Español del Siglo XXI (CORPES XXI), un proyecto en el que participa la Universitat de València, entre otras instituciones académicas.
La firma se ha celebrado en la sede de la Real Academia Española, en un acto al que asistieron algunos de los principales representantes de ambas corporaciones y en el que, además de José Manuel Blecua y Emilio Botín, intervino el académico Guillermo Rojo, coordinador del CORPES XXI.
El Corpus del Español del Siglo XXI (CORPES XXI) es un proyecto cuyo objetivo final es reunir, en 2014, un conjunto textual constituido por 300 millones de formas y palabras de la lengua común de 450 millones de hispanohablantes. Este corpus se elabora a partir de textos orales y escritos. El material proviene tanto de medios impresos —libros y prensa— como de contenidos publicados en Internet o emitidos en canales de información audiovisual.
El CORPES XXI, que supone la continuación del trabajo realizado con los corpus CREA y CORDE, es una iniciativa de la RAE y de la Asociación de Academias de la Lengua Española (ASALE) en la que trabajan, además del equipo central, ocho equipos externos a las Academias: seis de diferentes universidades españolas —Alcalá, Autónoma de Barcelona, León, Salamanca, Santiago de Compostela y Valencia—, la Academia Argentina de Letras y la Fundación Comillas. El CORPES XXI consta actualmente de cerca de 100 millones de formas. La previsión para los próximos tres años es incrementar esa cifra en 200 millones más, hasta llegar a 300, mediante la correspondiente selección, codificación e integración de materiales.
Los textos que integrarán el CORPES XXI reflejarán adecuadamente el español de todo el mundo: el 30 % de las formas procederán de España y el 70 % restante de América.
El convenio suscrito entre la RAE y Banco Santander incluye, además de la culminación del CORPES XXI, el apoyo económico para dotar al Archivo de la Real Academia Española de los medios tecnológicos con los que debe contar para realizar sus funciones de difusión y conservación.
El proyecto prevé dos fases: la informatización de las fichas descriptivas y la digitalización de las series documentales de mayor valor testimonial e histórico.