L’oferta de tecnologies lingüístiques en català ha augmentat 16 punts des del 2020
L’actualització del directori de tecnologies lingüístiques en català de la Secretaria de Política Lingüística confirma l’increment de l’oferta
El 74 % dels recursos d’intel·ligència artificial generativa més populars operen en català
La Secretaria de Política Lingüística ha actualitzat el directori La llengua catalana i les tecnologies del llenguatge, que recull els principals productes existents en el mercat i la seva disponibilitat en català.
L’actualització mostra un augment significatiu del nombre de productes i serveis digitals que inclouen el català. Si l’any 2020 s’havien detectat 70 productes en català de 159 analitzats, és a dir, un 44 %, en l’actualització d’enguany se n’han detectat 177 dels 295 analitzats, que suposen un 60 %. Hi ha hagut, doncs, un augment de 16 punts. L’increment absolut, així mateix, es pot xifrar en el 250 % (de 70 a 177 productes). L’actualització posa de manifest que en quatre anys s’han duplicat els recursos rellevants del sector (de 159 a 295).
La presència del català ha crescut en totes les tecnologies del llenguatge, especialment en l’àrea del reconeixement automàtic de la parla, en què s’ha quadruplicat en quatre anys, passant de 6 a 25 productes. També han augmentat molt les iniciatives relacionades amb els models de llenguatge extens (MLE o, en anglès, LLM) dins la categoria Sistemes d’interpretació del llenguatge natural. En aquest àmbit el català té una gran presència i, a més, es preveuen grans avenços en un futur pròxim. D’altra banda, el 74 % dels productes i serveis de l’àrea de les intel·ligències artificials orientades a la conversa i generació de text accepten el català.
Una eina per al foment del català en les tecnologies del llenguatge
La Secretaria de Política Lingüística impulsa la presència del català en les tecnologies del llenguatge i la intel·ligència artificial i difon l’existència de productes i serveis digitals en català per tal de fer-ne créixer l’oferta i potenciar-ne el consum i l’ús. El directori, dissenyat per facilitar aquests objectius, organitza els recursos tecnològics existents en català en sis grans àrees:
1. Sistemes de reconeixement automàtic de la parla (ASR).
2. Sistemes d’interpretació del llenguatge natural (NLU).
3. Sistemes de síntesi de la parla (TTS).
4. Assistents virtuals amb veu.
5. Sistemes de traducció simultània.
6. Intel·ligències artificials orientades a la conversa i generació de text.
Totes les eines recollides en el directori es poden filtrar i cercar per nom, descripció, codi lliure, disponibilitat en català i enllaços per accedir-hi. La facilitat d’accés a les dades permet constatar l’evolució de l’oferta en català en aquest sector no només als professionals de les tecnologies del llenguatge, sinó també a totes les persones interessades (estudiants, divulgadors, periodistes, etc.). La Secretaria actualitzarà el directori cada sis mesos, una freqüència condicionada pel creixement ràpid i l’evolució constant del sector.
Alguns reptes pendents
El directori també revela que el català té un resultat no gaire positiu en alguns sectors, com ara el dels productes i serveis relacionats amb activitats de lleure (ciclisme, senderisme, córrer). També permet detectar una disminució d’iniciatives en la categoria d’Assistents de veu, on el català té poca presència, a conseqüència de la davallada del consum d’aquests productes a causa del canvi de paradigma que estan suposant les IA generatives.
La iniciativa s’emmarca en el conjunt d’accions del Govern per impulsar el català en el sector digital en què tenen especial relleu projectes com Aina, executat pel BSC i liderat per la Secretaria de Polítiques Digitals.