IA i tecnolingüística: una aliança estratègica per a impulsar el valencià en l’ecosistema digital

El futur del valencià ja no es juga només als carrers, a les escoles o als mitjans públics. Es juga, sobretot, a Internet. Plataformes com TikTok, Twitch, YouTube o X (abans Twitter) són avui l’àgora on es formen les identitats, es negocien els imaginaris col·lectius i es construeixen els nous relats. I en eixe espai obert però profundament condicionat per la tecnologia i les regles algorítmiques, les llengües minoritzades parteixen amb desavantatge. Però això està canviant. La tecnolingüística i la intel·ligència artificial ens ofereixen un conjunt d’eines que poden capgirar la partida.


Tecnolingüística i IA: què vol dir exactament?

La tecnolingüística és la disciplina que estudia el llenguatge humà utilitzant tècniques computacionals i estadístiques. Quan parlem d’aplicar la intel·ligència artificial en aquest camp, ens referim a capacitats com ara:

  • Processament de llenguatge natural (PLN), per entendre el significat, el context i les emocions en textos digitals.
  • Anàlisi de sentiment, que permet identificar si un comentari o un text té to positiu, neutre o negatiu.
  • Detecció d’idioma, que pot afinar-se per a distingir valencià, català central, balear o varietats híbrides.
  • Extracció d’entitats, útil per detectar quan es parla de conceptes com “llengua”, “valencià”, “multilingüisme”, etc., i amb quin context semàntic.
  • Seguiment de tendències i temes emergents, que pot ajudar a detectar converses socials en què convé introduir el valencià.

Eines concretes per a monitorar l’ús del valencià

Hi ha un conjunt d’eines ja disponibles —algunes comercials, altres de codi obert— que poden ajudar a sistematitzar l’anàlisi del valencià en entorns digitals:

  • Brandwatch, Talkwalker o Sprout Social: plataformes de social listening que permeten fer seguiment de paraules clau, hashtags i emocions associades. Encara que no estan pensades específicament per a llengües minoritzades, poden adaptar-se.
  • Ushahidi: eina d’origen humanitari que permet cartografiar informacions rebudes per xarxes, correus o formularis, molt útil en entorns de resposta ciutadana o emergències, però també adaptable a monitoratge lingüístic localitzat.
  • Google Trends i Google BigQuery: per veure l’evolució de cerques en valencià, l’interès per temes concrets, o comparar termes com “escola en valencià” vs “escuela en valenciano”.
  • Eines de PLN com spaCy, HuggingFace o fastText, que poden entrenar-se específicament per identificar i analitzar textos en valencià.
  • GPT-4 i altres LLMs (Large Language Models): permeten generar informes, resums i visualitzacions a partir de dades textuals extretes automàticament, o fins i tot actuar com a agents conversacionals en valencià.
  • Datawrapper, Flourish o Tableau: per a visualitzar les dades recollides en mapes, gràfiques i dashboards útils per a institucions.

Potencialitats per a la promoció del valencià

Un bon sistema de tecnolingüística aplicada al valencià pot donar fruits en múltiples àmbits:

1. Diagnòstic i estratègia

Podem saber quines plataformes són més receptives al valencià, quin tipus de contingut genera més interacció i quines franges d’edat l’empren més. Això permet orientar millor les campanyes, les polítiques públiques o el contingut educatiu.

2. Disseny de campanyes digitals amb dades

Per exemple, si detectem que el valencià té presència a Instagram però quasi nul·la a TikTok, podem generar contingut específic (amb creadors joves, formats audiovisuals curts, mems…) i avaluar-ne l’impacte al moment.

3. Aliances amb creadors digitals

Monitorant les xarxes, podem identificar microinfluencers que ja usen el valencià o que tenen afinitat i podrien incorporar-lo. És més fàcil convèncer qui ja està prop que inventar des de zero.

4. Observatori de percepció

Amb IA podem saber si el valencià es veu com a llengua culta, divertida, rural, moderna… I actuar en conseqüència. També podem detectar discursos de menyspreu o polarització per prevenir i desmuntar rumors o prejudicis.

5. Eines per a la ciutadania

Amb interfícies senzilles, podem oferir a entitats i persones un accés a les dades lingüístiques del seu entorn digital, com un Google Analytics de la llengua. Això empodera la societat civil i estimula la participació activa.

6. Resposta automàtica en valencià

Chatbots, serveis d’atenció al client, webs institucionals… Amb IA, és tècnicament possible oferir una experiència plena en valencià a qualsevol usuari. Ja no hi ha excuses tècniques, només polítiques.


Cap a una agenda tecnolingüística per al valencià

El que plantegem no és només usar IA com a eina, sinó construir una agenda tecnolingüística que pose el valencià al centre del disseny digital. Açò implica:

  • Treballar conjuntament amb universitats i tecnòlegs per crear models entrenats en valencià.
  • Dotar de finançament públic i intercooperatiu iniciatives de recollida, anotació i classificació de dades en valencià.
  • Crear un organisme d’observació i acció tecnolingüística, amb capacitat per intervenir en la planificació digital.
  • Impulsar protocols oberts que permeten compartir dades lingüístiques de manera ètica i reutilitzable.

Si el valencià no entra en el futur digital per la porta gran, corre el risc de quedar reduït a una identitat nostàlgica. Però si sabem aprofitar les eines que ja tenim —i les potenciem amb decisió i col·laboració— podem garantir-li un lloc viu, útil i desitjable a la xarxa.

La llengua no és només memòria: és també estratègia, dades i algoritmes. És hora de connectar els punts. I fer que cada byte jugue a favor del valencià.