Central Android

Google Translate adaugă două duzini de limbi folosite de peste 300 de milioane de oameni

protection click fraud

Ce trebuie sa stii

  • În timpul Google I/O 2022, Google a anunțat că Google Translate va accepta 24 de limbi noi.
  • Este prima dată când limbile indigene americane sau un dialect englez sunt acceptate pe Translate.
  • Google folosește de obicei învățarea bilingvă pentru a traduce limbi, dar a folosit învățarea monolingvă pentru aceste noi limbi.
  • 133 de limbi în total sunt acum acceptate pe Google Translate.

Astăzi, în timpul Google IO 2022 Discursul principal, CEO-ul Google, Sundar Pichai, a anunțat că compania va aduce 24 de limbi noi la Google I/O, vizând limbi care sunt „subreprezentate astăzi pe web”.

„Mai mulți oameni folosesc Google Translate decât oricând, dar mai avem de făcut pentru ca acesta să fie accesibil universal”, a spus Pichai.

Google Translate se bazează de obicei pe „învățare bilingvă” pentru a traduce text, comparând expresii între două limbi pentru a traduce corect diferite expresii. Dar, deoarece aceste noi limbi au mai puțin text pe care AI-ul Google să-l aprofundeze, a trebuit să se bazeze pe „monolingv de învățare”, unde „modelul învață să traducă o nouă limbă fără să vadă vreodată o traducere a datelor a acesteia”.

Exemple Google Translate
(Credit imagine: Google)

Cele 24 de limbi enumerate mai jos acoperă aproximativ 310 milioane de oameni de pe tot globul și includ trei limbi indigene ale America (Quechua, Guarani și Aymara) și un dialect englez (Sierra Leonean Krio), toate acestea fiind primele pentru Google Traduceți.

  • Assamese, folosit de aproximativ 25 de milioane de oameni din nord-estul Indiei
  • Aymara, folosit de aproximativ două milioane de oameni în Bolivia, Chile și Peru
  • Bambara, folosită de aproximativ 14 milioane de oameni din Mali
  • Bhojpuri, folosit de aproximativ 50 de milioane de oameni din nordul Indiei, Nepal și Fiji
  • Dhivehi, folosit de aproximativ 300.000 de oameni din Maldive
  • Dogri, folosit de aproximativ trei milioane de oameni din nordul Indiei
  • Ewe, folosită de aproximativ șapte milioane de oameni din Ghana și Togo
  • Guarani, folosit de aproximativ șapte milioane de oameni din Paraguay și Bolivia, Argentina și Brazilia
  • Ilocano, folosit de aproximativ 10 milioane de oameni din nordul Filipinelor
  • Konkani, folosit de aproximativ două milioane de oameni din India Centrală
  • Krio, folosit de aproximativ patru milioane de oameni din Sierra Leone
  • Kurda (Sorani), folosită de aproximativ opt milioane de oameni, mai ales în Irak
  • Lingala, folosit de aproximativ 45 de milioane de oameni în Republica Democratică Congo, Republica Congo, Republica Centrafricană, Angola și Republica Sudan de Sud
  • Luganda, folosită de aproximativ 20 de milioane de oameni din Uganda și Rwanda
  • Maithili, folosit de aproximativ 34 de milioane de oameni din nordul Indiei
  • Meiteilon (Manipuri), folosit de aproximativ două milioane de oameni din nord-estul Indiei
  • Mizo, folosit de aproximativ 830.000 de oameni din nord-estul Indiei
  • Oromo, folosit de aproximativ 37 de milioane de oameni din Etiopia și Kenya
  • Quechua, folosit de aproximativ 10 milioane de oameni din Peru, Bolivia, Ecuador și țările învecinate
  • Sanscrită, folosită de aproximativ 20.000 de oameni din India
  • Sepedi, folosit de aproximativ 14 milioane de oameni din Africa de Sud
  • Tigrinya, folosită de aproximativ opt milioane de oameni din Eritreea și Etiopia
  • Tsonga, folosit de aproximativ șapte milioane de oameni din Eswatini, Mozambic, Africa de Sud și Zimbabwe
  • Twi, folosit de aproximativ 11 milioane de oameni din Ghana

Isaac Caswell și Ankur Bapna, cercetători pentru Google Translate, au scris o postare tehnică pentru Blogul Google AI care detaliază modul în care funcționează noile lor instrumente de traducere monolingvă sau „traducere fără resurse”. Este dens din punct de vedere tehnic, dar explică modul în care Google a creat seturi de date pentru 1138 de limbi pentru a „învăța reprezentări ale limbilor cu resurse insuficiente direct din textul monolingv”.

Google Translate a parcurs un drum lung în ultimii ani. Pixeli recenti precum Pixel 6 poate sa Traducere live cuvinte rostite sau text vizualizat printr-o cameră din zeci de limbi. Acum, telefoane Android va deveni mai utilă pentru comunitățile de pe tot globul care au fost lăsate în urmă de tehnologia care vizează doar câteva limbi.

În alte știri Google IO legate de limbă, Pichai a remarcat că subtitrările generate automat de YouTube sunt acum disponibile în 16 limbi.

instagram story viewer