Google Translate adaugă 110 limbi noi, cel mai mare update de până acum al platformei, a anunțat compania joi. Iar totul se datorează progreselor în domeniul inteligenței artificiale.
Modelul lingvistic PaLM 2 al Google a ajutat Translate să învețe mai eficient limbi strâns legate între ele, a spus inginerul software de la Google, Isaac Caswell, într-un comunicat. Acesta include „limbi apropiate de hindi, cum ar fi Awadhi și Marwadi, și creole franceze, cum ar fi Creola Seychellois și Creola Mauritiană.”
Alte limbi noi includ Afar, cantoneză și tamazight (amazigh). Google spune că noile limbi reprezintă peste 614 milioane de oameni, adică aproximativ 8% din populația lumii. Aproximativ un sfert dintre acestea provin din Africa, ceea ce face ca cel de acum să fie cel mai mare update pentru limbile africane de pe Google Translate, de până acum.
Dacă o limbă are varietăți regionale și dialecte, modelele lingvistice ale Google creează o versiune hibridă combinând diferite elemente. Compania spune că prioritizează „cele mai utilizate varietăți ale fiecărei limbi”.
De exemplu, mai notează compania, „romani este o limbă care are multe dialecte în toată Europa. LLM-urile produc text care este cel mai apropiat de Romani Vlax de Sud, o varietate des folosită online. Dar amestecă și elemente din alte dialecte, cum ar fi Vlax de Nord și Romani Balcanic.”
În 2022, Google a adăugat 24 de limbi noi la Translate folosind ceea ce se numește Zero-Shot Machine Translation, în care un model de învățare automată poate traduce într-o altă limbă fără să vadă un exemplu. De asemenea, a introdus inițiativa 1.000 Languages, care își propune să construiască modele AI pentru a susține cele mai vorbite 1.000 de limbi.
„Pe măsură ce tehnologia avansează și pe măsură ce continuăm să colaborăm cu experți lingviști și vorbitori nativi, vom putea susține și mai multe varietăți de limbi și convenții de ortografie pe parcursul timpului”, a mai spus Caswell în comunicat.