Cerca

Veneto

Google Translate ora traduce il dialetto ma i test evidenziano tanti problemi

A creare limiti la variazione linguistica da territorio a territorio

Google Translate parla friulano: un passo avanti per la lingua madre del Friuli

L'introduzione del veneto e di altri dialetti italiani nell'aggiornamento di Google Translate, avvenuta di recente, ha suscitato notevoli aspettative. Tuttavia, i primi test effettuati dal team di AlpiLinK, un macroprogetto per la mappatura digitale dei dialetti del Nord Italia guidato dall'Università di Verona, evidenziano numerosi limiti e problematiche.

Secondo il coordinatore del progetto, Stefan Rabanus, docente di linguistica tedesca all'ateneo di Verona, "Rispetto all'italiano, il veneto dimostra una variazione linguistica molto forte da territorio a territorio: alcune parole e costruzioni usate a Verona non vengono riconosciute a Treviso e viceversa".

L'analisi, raccolta in un report, mostra come termini dialettali comuni nel Veneto siano tradotti erroneamente da Google Translate. Ad esempio, "putela" e "buteleta", termini veronesi per indicare una ragazza, vengono tradotti rispettivamente come "avvolgere" e "burro". Anche "fiola", usato nel Veneziano per ragazza, è tradotto solo come "figlia", mentre "tosa", un termine padovano, è l'unico riconosciuto correttamente come ragazza. In altri casi, "mula" (Bellunese) viene tradotto con "viola".

Le traduzioni di frasi non offrono risultati migliori. Ad esempio, "tu dormi più di lui" viene tradotto correttamente in alcune aree del Veneziano e Padovano come "ti te dormi più de lu", ma variazioni locali come "ti te dormi piassè de lu" a Bonavigo (Verona) o "ti te dormi (de) pi de elo" a Chioggia (Venezia) non sono riconosciute.

Rabanus sottolinea: "La recente introduzione di alcuni dialetti italiani nell'aggiornamento di Google Translate, pur riconoscendo il valore dei dialetti e delle lingue minoritarie, è soggetta a molti limiti. Le denominazioni come 'veneto' non si riferiscono a una lingua unitaria ma a una molteplicità di dialetti, rendendo il traduttore vulnerabile. È necessario un corpus molto più ampio e diversificato e la possibilità di specificare il tipo di 'veneto' per evitare errori".

Un altro limite è l'assenza del riconoscimento vocale per i dialetti, disponibile invece per l'italiano. AlpiLinK, al contrario, basa la sua ricerca sulla raccolta di contributi audio. Attraverso il sito alpilink.it, chiunque parli un dialetto può partecipare alla ricerca compilando un audio-sondaggio, utilizzando il proprio dialetto per descrivere scene o tradurre parole e frasi.

Il progetto ha già visto la partecipazione di quasi 2500 persone, producendo circa 225 mila file audio. Questo database open è stato utilizzato anche per analizzare l'attendibilità dei risultati di Google Translate. "Un grande lavoro di mappatura che forse, in futuro, si potrà rivelare utile per allenare modelli di intelligenza artificiale e contribuire a superare i limiti attuali", conclude Rabanus.

L'invito a contribuire al progetto è aperto a tutti attraverso il sito alpilink.it.

Resta aggiornato, iscriviti alla nostra newsletter

Commenta scrivi/Scopri i commenti

Condividi le tue opinioni su

Caratteri rimanenti: 400