Android Centrala

Google prevoditelj dodaje dva tuceta jezika koje koristi preko 300 milijuna ljudi

protection click fraud

Što trebaš znati

  • Tijekom Google I/O 2022., Google je najavio da će Google Translate podržavati 24 nova jezika.
  • Ovo je prvi put da su autohtoni američki jezici ili engleski dijalekt podržani na Translateu.
  • Google obično koristi dvojezično učenje za prevođenje jezika, ali koristio je jednojezično učenje za te nove jezike.
  • Google prevoditelj sada podržava ukupno 133 jezika.

Danas, tijekom Google IO 2022 u glavnom govoru, izvršni direktor Googlea Sundar Pichai najavio je da će tvrtka donijeti 24 nova jezika na Google I/O, ciljajući na jezike koji su "danas nedovoljno zastupljeni na webu".

"Više ljudi koristi Google Translate nego ikada prije, ali još uvijek moramo raditi kako bismo ga učinili univerzalno dostupnim", rekao je Pichai.

Google prevoditelj obično se oslanja na "dvojezično učenje" za prevođenje teksta, uspoređujući fraze između dva jezika kako bi pravilno preveo različite fraze. Ali budući da ovi novi jezici imaju manje teksta u koji Googleova umjetna inteligencija može zaroniti, morala se osloniti na "jednojezične učenje", gdje "model uči prevoditi novi jezik bez da ikada vidi njegov prijevod podataka."

Primjeri Google prevoditelja
(Kredit za sliku: Google)

Dolje navedena 24 jezika pokrivaju oko 310 milijuna ljudi diljem svijeta i uključuju tri autohtona jezika Amerike (kečua, guarani i ajmara) i engleski dijalekt (Sierra Leonean Krio), koji su svi prvi za Google Prevedi.

  • Asamski, koristi ga oko 25 milijuna ljudi u sjeveroistočnoj Indiji
  • Aymara, koju koristi oko dva milijuna ljudi u Boliviji, Čileu i Peruu
  • Bambara, koju koristi oko 14 milijuna ljudi u Maliju
  • Bhojpuri, koji koristi oko 50 milijuna ljudi u sjevernoj Indiji, Nepalu i Fidžiju
  • Dhivehi, koristi ga oko 300.000 ljudi na Maldivima
  • Dogri, koji koristi oko tri milijuna ljudi u sjevernoj Indiji
  • Ewe, koristi ga oko sedam milijuna ljudi u Gani i Togu
  • Guarani, koji koristi oko sedam milijuna ljudi u Paragvaju i Boliviji, Argentini i Brazilu
  • Ilocano, koji koristi oko 10 milijuna ljudi na sjeveru Filipina
  • Konkani, koji koristi oko dva milijuna ljudi u središnjoj Indiji
  • Krio, koji koristi oko četiri milijuna ljudi u Sierra Leoneu
  • kurdski (sorani), koristi ga oko osam milijuna ljudi, uglavnom u Iraku
  • Lingala, koju koristi oko 45 milijuna ljudi u Demokratskoj Republici Kongo, Republici Kongo, Srednjoafričkoj Republici, Angoli i Republici Južni Sudan
  • Luganda, koristi ga oko 20 milijuna ljudi u Ugandi i Ruandi
  • Maithili, koji koristi oko 34 milijuna ljudi u sjevernoj Indiji
  • Meiteilon (Manipuri), koristi ga oko dva milijuna ljudi u sjeveroistočnoj Indiji
  • Mizo, koristi ga oko 830.000 ljudi u sjeveroistočnoj Indiji
  • Oromo, koji koristi oko 37 milijuna ljudi u Etiopiji i Keniji
  • Quechua, koristi ga oko 10 milijuna ljudi u Peruu, Boliviji, Ekvadoru i okolnim zemljama
  • Sanskrt, koji koristi oko 20 000 ljudi u Indiji
  • Sepedi, koristi ga oko 14 milijuna ljudi u Južnoj Africi
  • Tigrinya, koju koristi oko osam milijuna ljudi u Eritreji i Etiopiji
  • Tsonga, koju koristi oko sedam milijuna ljudi u Eswatiniju, Mozambiku, Južnoj Africi i Zimbabveu
  • Twi, koristi ga oko 11 milijuna ljudi u Gani

Isaac Caswell i Ankur Bapna, istraživači za Google Translate, napisali su tehnički post za Google AI blog s pojedinostima o tome kako funkcioniraju njihovi novi alati za jednojezično prevođenje ili "prevođenje bez resursa". Tehnički je gust, ali objašnjava kako je Google stvorio skupove podataka za 1138 jezika kako bi "naučio prikaze jezika s nedovoljno resursa izravno iz jednojezičnog teksta".

Google Translate napravio je dug put u posljednjih nekoliko godina. Nedavni pikseli poput Pixel 6 limenka Prevoditelj uživo izgovorene riječi ili tekst gledan kroz kameru s desetaka jezika. Sada, Android telefoni postat će korisniji za zajednice diljem svijeta koje su povijesno bile zaostale zbog tehnologije koja cilja na samo nekoliko jezika.

U drugim Google IO vijestima vezanim uz jezik, Pichai je primijetio da su YouTubeovi automatski generirani opisi sada dostupni na 16 jezika.

instagram story viewer