¿Prefieres escucharlo? Clica AQUÍ
Según la UNESCO, de las 6700 lenguas que se hablan en el mundo, el 40% de ellas están amenazadas. El español no es una de ellas, lo hablan 600 millones de personas de forma nativa o aprendida, es una de las 6 lenguas oficiales de Naciones Unidas y la segunda por número de habitantes en el mundo, tras el chino, y la tercera en el cómputo global de hablantes. (nativos más estudiantes)
En el último año, más de 24 millones de alumnos han estudiado español como lengua extranjera. En 2060 Estados Unidos será el segundo país hispanohablante del mundo después de México.
Dicen los lingüistas que el español es uno de los idiomas que mejor expresa las emociones. La cultura, su literatura, la fuerza expresiva para describir emociones y el número y extensión de países hispanohablantes lo hacen enormemente atractivo.
Sin embargo, en otros campos, como la investigación o la ciencia y a pesar de tener excelentes investigadores (el 15% de las publicaciones científicas españolas del 2020 en Scopus están entre las más citadas del mundo), el español anda muy por detrás del inglés. Aún así es el segundo idioma en la producción científica.
Colocar el español en el mundo de la ciencia es apostar por la digitalización en español. La inteligencia artificial es un entorno que tiene más de 50 años, pero han sido los diez últimos los que han visto un crecimiento exponencial debido principalmente al funcionamiento de grandes ordenadores capaces de procesar ingentes cantidades de datos a gran velocidad. Por que la IA se nutre de datos, sin datos no es nada, no es posible.
Y en esa ingesta de datos es donde está la clave. El sistema aprende a base de ingerir textos, imágenes, sonidos, etc. Y esto que aparentemente es fácil, es, en realidad, de una enorme complejidad si queremos hacerlo bien. Porque si entra un mal dato, un dato basura, un dato sesgado, un dato machista o un dato homófobo o racista, sale un resultado igual.
El corpus lingüístico que se utiliza para las aplicaciones de inteligencia artificial es escaso en lengua española. Y el futuro inmediato es un entorno en el que manejaremos continuamente aplicaciones y sistemas de inteligencia artificial para labores tanto cotidianas como sofisticadas. De hecho ya lo hacemos y no sé si somos conscientes de hasta qué punto.
O apostamos fuerte por nuestra comunidad y por nuestro idioma o todos al inglés y a sufrir las traducciones de los resultados que devuelva el sistema.
Con motivo de los Fondos de Recuperación, Transformación y Resiliencia de la Unión Europea, el Estado español elaboró un Plan (PRTR) con numerosas lineas de actuación. Una de ellas es una decidida apuesta por la digitalización. Uno de los proyectos que arman ese plan es el Proyecto Estratégico (PERTE) de la Nueva Economía de la Lengua dotado con mil cien millones de euros. Una colaboración público privada cuyo objetivo es impulsar el español como pieza fundamental en el proceso de transformación de la economía del conocimiento y de la inteligencia artificial, situando a España como referente de la comunidad hispanohablante
Entre los ejes estratégicos que aunarán la acción conjunta de las Administraciones Públicas y los centros y empresas de investigación, figura la creación de un Observatorio Global del Español.
Este observatorio depende del Instituto Cervantes, adscrito al Ministerio de Exteriores responsable de la formulación, coordinación y ejecución de la política exterior de España para la defensa y promoción del español en el mundo. Está presidido por el Ministro de Exteriores y formado por representantes de varios ministerios y del Gobierno de La Rioja, porque en La Rioja está ese monasterio donde se encontró la glosa en el incipiente castellano en el margen de un libro de oraciones del siglo X.
Nunca una sede fue tan bien escogida.
Ese Observatorio se dedicará a estudiar la situación del español en el mundo, incluyendo la perspectiva de la nueva economía digital y realizará el seguimiento de las actuaciones comprendidas en el proyecto.
Además, se impulsará la producción audiovisual y el sector del videojuego en español que ya factura casi 1800 millones de euros al año y sigue creciendo y generando miles de empleos. Se digitalizará la producción de los centros de certificación de aprendizaje del español y se divulgará la ciencia en español y la consolidación del patrimonio técnico-científico hispanohablante
En aras de alcanzar los objetivos del proyecto Lengua Española e Inteligencia Artificial (LEIA) se ha iniciado una actuación conjunta con la Real Academia Española, la Biblioteca Nacional y el Centro Nacional de Supercomputación (que cuenta con el súper ordenador más potente de España), para la creación de corpus lingüísticos formados por textos de todo tipo (literarios, noticias, guiones de cine, canciones, teatro…).
En este asunto es donde se hace preocupante la falta de mujeres en la rama de analítica de datos de la IA. Tenemos la oportunidad de evitar perpetuar los roles del pasado, cuando la mujer era un ser subalterno del hombre. Recordemos que los asistentes virtuales, Siri, Cortana, Alexa, son voces femeninas. ¿Os habéis preguntado por qué? Recordemos que la voz y el lenguaje son tremendamente evocadoras de emociones y que de la emoción surge la acción.
Tenemos muchos ejemplos. Amazon utilizó la IA para crear un sistema de contratación, pero lo alimentó con información utilizando datos de contrataciones durante los últimos diez años, como en ese periodo había contratado mayoritariamente hombres, el sistema entendió que las mujeres no eran aptas para el puesto.
Si ingestamos datos de mujeres con un determinado perfil y características, el sistema aprenderá que solo esas características definen a una mujer. Y aquí lo podemos hacer bien o lo podemos seguir haciendo mal.
Curiosamente, la UNESCO advierte de la “paradoja de la igualdad de género en las TIC”, los países con los niveles más altos de igualdad de género tienen las proporciones más bajas de mujeres con títulos avanzados en informática y materias relacionadas. Y sin embargo, los países peor situados en igualdad de género tienen los porcentajes más altos de mujeres tituladas en tecnología avanzada.
Lo cual, en mi opinión no quiere decir que estas últimas mujeres hagan un correcto tratamiento del dato ya que pueden ser redirigidas por los intereses políticos, pero desde luego, llama mucho la atención.
Pero la reflexión que dejo para el lector es: Si vivimos en una sociedad emocional, con sesgos y prejuicios declarados y arraigados ¿es realmente posible que un humano por naturaleza imperfecto ingeste datos limpios, objetivos y decodificados? Si el dato es el primer elemento y el sine qua non de un sistema de Inteligencia Artificial, seremos capaces de crear algo realmente perfecto o solo replicaremos la imperfección?
Fuentes: Ministerio de Asuntos económicos y Transformación digital, Instituto Cervantes, UNESCO, Ponencia de Montaña Merchán en el IV Congreso Asociación Mujeres en el Sector Público.
Video complemento 2’10”