¿Podrá la IA salvar el idioma laz de Turquía, que se encuentra en peligro de extinción?
Con pocos hablantes jóvenes y escaso apoyo oficial, los activistas recurren a la inteligencia artificial para ayudar a preservar una de las lenguas en peligro de extinción de Turquía: el laz.
ANKARA — En las brumosas montañas y pueblos costeros del este del Mar Negro de Turquía, el idioma laz , que una vez resonó en las calles de los pequeños pueblos, ahora pervive principalmente en las tranquilas casas de los bisabuelos, y los activistas están recurriendo a la IA en un intento por evitar que desaparezca.
El Instituto Laz, con sede en Estambul, busca voluntarios laz para entrenar la inteligencia artificial en su idioma a través del programa Common Voice de Mozilla, creando un archivo digital que podría preservar la lengua, cada vez más amenazada de extinción. Sin embargo, los expertos advierten que se necesitan otros métodos —como la educación, el apoyo institucional y la participación comunitaria— para mantener viva la lengua laz.
El laz, una lengua kartveliana o caucásica meridional, se habla principalmente en las provincias turcas del noreste, a orillas del Mar Negro: Rize, ciudad natal del presidente Recep Tayyip Erdogan , y Artvin, cerca de la frontera con Georgia. En menor medida, también se habla en la región de Mármara, al noroeste de Turquía, y en algunas zonas del suroeste de Georgia.
A los laz de Turquía se les suele asociar con cualidades arraigadas en el folclore y los chistes del país: mal genio, franqueza sin rodeos y, a veces, tendencia a darle demasiadas vueltas a las cosas. El famoso humorista turco Cem Yilmaz plasma este espíritu en una anécdota personal sobre los habitantes de la costa del Mar Negro: cuando le preguntó a un lugareño cómo llegar al aeropuerto, este hizo una pausa y respondió: «¿Aeropuerto? ¿Te refieres al… de los aviones?».
Un idioma que se desvanece
Además de estos estereotipos lúdicos, el pueblo laz se enfrenta a una realidad más seria: lucha por afirmar su identidad como comunidad diferenciada con lengua, tradiciones y costumbres propias. La UNESCO clasifica a los laz como un grupo étnico minoritario. La lengua laz se considera “definitivamente en peligro de extinción”, citando la disminución de su uso diario, la debilitada transmisión a los niños y la falta de estatus oficial tanto en Turquía como en Georgia.
Como Turquía no recopila datos oficiales sobre poblaciones étnicas, se desconoce el número exacto de personas laz que viven en el país, aunque las estimaciones lo sitúan cerca de 600.000. De ellas, se cree que solo la mitad habla laz de forma activa.
Según Irfan Cagatay, autor de «El laz en el Imperio Otomano tardío (1877-1923)», uno de los estudios más completos sobre la identidad laz en Turquía, el declive de la lengua se aceleró tras la fundación de la República Turca moderna, ya que los esfuerzos de construcción nacional desalentaron el uso del laz y de cualquier otra lengua minoritaria. En 1924, el país estableció el turco como lengua oficial de instrucción, relegando a un segundo plano la enseñanza de otras lenguas de minorías musulmanas en las escuelas.
“Las autoridades turcas priorizaron el idioma como símbolo de unidad, extendiendo los servicios gubernamentales, las escuelas y la vida pública al turco”, dijo Cagatay a Al-Monitor.
La integración urbana propició una mayor incorporación de las comunidades laz a la sociedad turca en su conjunto, añadió Cagatay. Tras años de aislamiento en las escarpadas montañas del Mar Negro, sus habitantes tenían menos incentivos para usar el laz en la vida cotidiana y más motivos para hablar turco.
“Con el tiempo, el laz se convirtió en una lengua que solo se hablaba en las casas de los abuelos o incluso de los bisabuelos”, añadió.
Enseñando a Laz a usar la IA
A medida que Laz se retiraba gradualmente de la vida cotidiana, los activistas buscaron nuevas formas de preservarlo, y el Instituto Laz ha estado a la vanguardia de estos esfuerzos durante más de una década.
La iniciativa más reciente del instituto recurre a la IA para crear archivos digitales del idioma. Esta iniciativa lleva dos años trabajando para integrar Laz en el programa Common Voice de Mozilla, una plataforma de código abierto que entrena la tecnología de reconocimiento de voz mediante grabaciones enviadas por hablantes comunes.
Imagen tomada durante la formación en lengua laz para profesores en 2022 (Instituto Laz).
“Este proyecto es importante no solo para aumentar la visibilidad del laz y crear conciencia sobre el idioma”, dijo Ismail Avci, director del Instituto Laz, a Al-Monitor, “sino también para construir un repositorio de datos serio”.
El programa Common Voice de Mozilla, lanzado en 2017, tenía como objetivo inicial crear un conjunto de datos de voz abierto y diverso que cualquiera pudiera usar para tecnologías de reconocimiento de voz, según su sitio web. Con el tiempo, se amplió para incluir lenguas en peligro de extinción y poco representadas. En 2025, Common Voice albergaba grabaciones en más de 140 lenguas, muchas de ellas con pocos recursos o en peligro de extinción, como el quechua yauyos de Perú, el tush del Cáucaso Norte y el bebele de Camerún, según indicó el Fondo para el Voz Multilingüe Abierto de Mozilla en su sitio web.
Mediante Common Voice, voluntarios leen frases cortas en voz alta y otros verifican los fragmentos; el audio validado pasa a formar parte de una base de datos pública para uso de desarrolladores e investigadores.
Con la esperanza de que la incorporación del laz a este ecosistema asegure su presencia en el mundo digital, el instituto ha preparado cerca de 10.000 frases en laz para su inclusión en la base de datos, de las cuales aproximadamente la mitad ya han sido subidas, dijo Avci.
Ahora, el proyecto necesita voluntarios que hablen laz y puedan grabar frases. En su columna para la plataforma de noticias independiente turca Bianet, Avci hizo un llamado a los hablantes de laz para que se unan como voluntarios a la iniciativa.
«Incluso en el cálculo más conservador, necesitamos unos 250 voluntarios, pero siendo realistas, cerca de 1000», declaró Avci a Al-Monitor. Confía en que el proyecto fortalecerá los lazos comunitarios e impulsará una amplia movilización entre los hablantes de laz.
El proyecto no tiene un cronograma fijo y su ritmo dependerá en gran medida de cuántos voluntarios se presenten.
La trayectoria de Laz: De los márgenes a la corriente principal
Durante mucho tiempo, Turquía trató las lenguas minoritarias como si amenazaran la unidad nacional, especialmente en medio de las tensiones con la población kurda y sus reivindicaciones de derechos culturales y lingüísticos. El panorama comenzó a cambiar a finales de la década de 1990, cuando las reformas destinadas a facilitar la adhesión de Turquía a la Unión Europea abrieron un espacio, aunque reducido, significativo para la expresión cultural. El músico Kazim Koyuncu, natural de Artvin, popularizó la lengua kurda con su álbum «Laz», que le brindó su primer público nacional en 1995.
Un tamaño mayor El cambio se produjo durante las conversaciones de paz de 2012-2015 entre Ankara y el Partido de los Trabajadores del Kurdistán , que ha librado una insurgencia armada por la autonomía kurda desde 1984. Como parte de la apertura, el gobierno de Erdogan promulgó reformas políticas que permitieron cursos electivos de kurdo y otras lenguas minoritarias en las escuelas públicas, un gesto pequeño pero simbólico que reconoció la realidad multilingüe de Turquía.
El Instituto Laz, fundado en 2013, aprovechó esa oportunidad, capacitando a maestros y reuniendo los materiales necesarios para llevar el método Laz al aula.
Sin embargo, el entusiasmo inicial por las clases optativas de laz en Rize y Artvin acabó por desvanecerse, según Avci. Ante la falta de incentivos para aprender laz y la disminución del apoyo institucional —ya que los cursos de lenguas minoritarias se consideraban costosos para el Estado—, el Ministerio de Educación comenzó a añadir otras asignaturas optativas a su currículo, presentándolas como alternativas más prácticas a las clases de lenguas minoritarias.
La IA no es una cura real
Ante este panorama, enseñar Laz a las máquinas es, en el mejor de los casos, una modesta línea de defensa para un idioma amenazado.
"Por supuesto, esta iniciativa no evitará que Laz corra el peligro de desaparecer", reconoció Avci.
"Que la IA aprenda Laz significa que el idioma sobrevive en el mundo digital, mientras ese mundo exista, incluso si corre el riesgo de desaparecer en la vida cotidiana", dijo.
Muchas lenguas en peligro de extinción, incluida la lengua laz, sufren de escasa documentación, lo que puede hacer que el entrenamiento de la IA sea poco fiable, según un artículo de MIT Technology Review publicado en septiembre.
Los modelos de aprendizaje automático funcionan mejor con conjuntos de datos anotados grandes y de alta calidad, y para los idiomas con pocos recursos, a menudo no hay suficientes textos escritos, grabaciones o traducciones verificadas para entrenar los modelos adecuadamente, señala el artículo.
En definitiva, para preservar a Laz se necesitará algo más que IA o esfuerzos aislados en el aula, coincidieron ambos expertos.
"El laz necesita discriminación positiva", dijo Cagatay, como clases obligatorias de laz en las escuelas de pueblos predominantemente laz, o exigir conocimientos de laz para ciertos puestos de la administración pública en esas áreas.