Android Centrālais

Google tulkotājs pievieno divus desmitus valodu, kuras lieto vairāk nekā 300 miljoni cilvēku

protection click fraud

Kas jums jāzina

  • Google I/O 2022 laikā Google paziņoja, ka Google tulkotājs atbalstīs 24 jaunas valodas.
  • Šī ir pirmā reize, kad pakalpojumā Tulkotājs tiek atbalstītas Amerikas pamatiedzīvotāju valodas vai angļu valodas dialekts.
  • Google parasti izmanto bilingvālo mācīšanos valodu tulkošanai, taču šīm jaunajām valodām izmantoja vienvalodu apguvi.
  • Google tulkotājs tagad atbalsta 133 valodas.

Šodien, laikā Google IO 2022 Google izpilddirektors Sundars Pichai paziņoja, ka uzņēmums Google I/O ieviesīs 24 jaunas valodas, mērķējot uz valodām, kuras "šobrīd tīmeklī ir nepietiekami pārstāvētas".

"Vairāk cilvēku izmanto Google tulkotāju nekā jebkad agrāk, taču mums vēl ir jāstrādā, lai tas būtu vispārēji pieejams," sacīja Pichai.

Lai pareizi tulkotu dažādas frāzes, Google tulkotājs parasti paļaujas uz "bilingvālo apmācību", lai tulkotu tekstu, salīdzinot frāzes divās valodās. Taču, tā kā šajās jaunajās valodās ir mazāk teksta, lai Google AI varētu iedziļināties, tai bija jāpaļaujas uz "vienvalodu mācīšanās”, kur “modelis mācās tulkot jaunu valodu, nekad neredzot tās datu tulkojumu”.

Google tulkotāja piemēri
(Attēla kredīts: Google)

Tālāk uzskaitītās 24 valodas aptver aptuveni 310 miljonus cilvēku visā pasaulē, un tās ietver trīs vietējās valodas. Amerika (kečua, guarani un aimara) un angļu valodas dialekts (Sierra Leonean Krio), kas visi ir pirmie Google Tulkot.

  • Asamiešu valoda, ko lieto aptuveni 25 miljoni cilvēku Indijas ziemeļaustrumos
  • Aymara, ko izmanto aptuveni divi miljoni cilvēku Bolīvijā, Čīlē un Peru
  • Bambara, ko Mali izmanto aptuveni 14 miljoni cilvēku
  • Bhojpuri, ko izmanto aptuveni 50 miljoni cilvēku Indijas ziemeļos, Nepālā un Fidži
  • Dhivehi, ko Maldivu salās izmanto aptuveni 300 000 cilvēku
  • Dogri, ko izmanto aptuveni trīs miljoni cilvēku Indijas ziemeļos
  • Ewe, izmanto aptuveni septiņi miljoni cilvēku Ganā un Togo
  • Guarani, ko lieto aptuveni septiņi miljoni cilvēku Paragvajā un Bolīvijā, Argentīnā un Brazīlijā
  • Ilocano, ko izmanto aptuveni 10 miljoni cilvēku Filipīnu ziemeļos
  • Konkani, ko izmanto aptuveni divi miljoni cilvēku Centrālajā Indijā
  • Krio, ko izmanto aptuveni četri miljoni cilvēku Sjerraleonē
  • kurdu (Sorani), ko izmanto aptuveni astoņi miljoni cilvēku, galvenokārt Irākā
  • Lingala, ko izmanto aptuveni 45 miljoni cilvēku Kongo Demokrātiskajā Republikā, Kongo Republikā, Centrālāfrikas Republikā, Angolā un Dienvidsudānas Republikā
  • Luganda, ko Ugandā un Ruandā izmanto aptuveni 20 miljoni cilvēku
  • Maithili, ko izmanto aptuveni 34 miljoni cilvēku Indijas ziemeļos
  • Meiteilon (Manipuri), ko izmanto aptuveni divi miljoni cilvēku Indijas ziemeļaustrumos
  • Mizo, ko izmanto aptuveni 830 000 cilvēku Indijas ziemeļaustrumos
  • Oromo, ko izmanto aptuveni 37 miljoni cilvēku Etiopijā un Kenijā
  • Kečua, ko lieto apmēram 10 miljoni cilvēku Peru, Bolīvijā, Ekvadorā un apkārtējās valstīs
  • Sanskrits, ko Indijā lieto aptuveni 20 000 cilvēku
  • Sepedi, ko izmanto aptuveni 14 miljoni cilvēku Dienvidāfrikā
  • Tigrinya, ko izmanto aptuveni astoņi miljoni cilvēku Eritrejā un Etiopijā
  • Tsonga, ko izmanto aptuveni septiņi miljoni cilvēku Esvatīni, Mozambikā, Dienvidāfrikā un Zimbabvē
  • Twi, izmanto aptuveni 11 miljoni cilvēku Ganā

Īzaks Kasvels un Ankurs Bapna, Google tulkotāja pētnieki, uzrakstīja tehnisku ziņu vietnei Google AI emuārs sīki izklāstot, kā darbojas viņu jaunie vienvalodu tulkošanas jeb "nulles resursu tulkošanas" rīki. Tas ir tehniski blīvs, taču paskaidro, kā Google izveidoja datu kopas 1138 valodām, lai "mācītos valodu attēlojumus ar nepietiekamu resursiem tieši no vienvalodu teksta".

Google tulkotājs pēdējos gados ir nogājis garu ceļu. Jaunākie pikseļi, piemēram, Pixel 6 var Tiešsaistes tulkojums izrunāti vārdi vai teksts, kas skatīts caur kameru no desmitiem valodu. Tagad Android tālruņi kļūs noderīgākas kopienām visā pasaulē, kuras vēsturiski ir atpalikušas no tehnoloģijām, kuru mērķauditorija ir tikai dažas valodas.

Citās ar valodām saistītās Google IO ziņās Pichai atzīmēja, ka YouTube automātiski ģenerētie subtitri tagad ir pieejami 16 valodās.

instagram story viewer