Android Centrála

Prekladač Google pridáva dva tucty jazykov, ktoré používa viac ako 300 miliónov ľudí

protection click fraud

Čo potrebuješ vedieť

  • Počas Google I/O 2022 Google oznámil, že Google Translate bude podporovať 24 nových jazykov.
  • Je to prvýkrát, čo sú v Prekladači podporované domorodé americké jazyky alebo anglický dialekt.
  • Google zvyčajne používa dvojjazyčné učenie na preklad jazykov, ale pre tieto nové jazyky používa jednojazyčné učenie.
  • Prekladač Google teraz podporuje celkovo 133 jazykov.

Dnes, počas Google IO 2022 hlavný prejav, generálny riaditeľ Google Sundar Pichai oznámil, že spoločnosť prinesie na Google I/O 24 nových jazykov so zameraním na jazyky, ktoré sú „dnes na webe nedostatočne zastúpené“.

„Prekladač Google používa viac ľudí ako kedykoľvek predtým, ale stále máme čo robiť, aby sme ho sprístupnili pre všetkých,“ povedal Pichai.

Prekladač Google sa pri preklade textu zvyčajne spolieha na „dvojjazyčné učenie“, pričom porovnáva frázy medzi dvoma jazykmi, aby sa správne preložili rôzne frázy. Ale keďže tieto nové jazyky majú menej textu, do ktorého sa môže umelá inteligencia Google ponoriť, musela sa spoliehať na „jednojazyčné learning“, kde sa „model učí prekladať nový jazyk bez toho, aby videl preklad jeho údajov“.

Príklady prekladača Google
(Obrázkový kredit: Google)

24 jazykov uvedených nižšie pokrýva približne 310 miliónov ľudí na celom svete a zahŕňa tri domorodé jazyky Ameriky (Quechua, Guarani a Aymara) a anglický dialekt (Sierra Leonean Krio), z ktorých všetky sú pre Google prvé Preložiť.

  • Assamese, ktorý používa asi 25 miliónov ľudí v severovýchodnej Indii
  • Aymara, ktorú používajú asi dva milióny ľudí v Bolívii, Čile a Peru
  • Bambara, ktorú v Mali používa asi 14 miliónov ľudí
  • Bhojpuri, ktorý používa asi 50 miliónov ľudí v severnej Indii, Nepále a na Fidži
  • Dhivehi, ktorý na Maldivách používa asi 300 000 ľudí
  • Dogri, ktorý v severnej Indii používajú asi tri milióny ľudí
  • Ewe, ktorú používa asi sedem miliónov ľudí v Ghane a Togu
  • Guarani, ktorý používa asi sedem miliónov ľudí v Paraguaji a Bolívii, Argentíne a Brazílii
  • Ilocano, ktorý používa asi 10 miliónov ľudí na severe Filipín
  • Konkani, ktorú používajú asi dva milióny ľudí v strednej Indii
  • Krio, ktorý používajú asi štyri milióny ľudí v Sierra Leone
  • kurdský (Sorani), ktorý používa asi osem miliónov ľudí, väčšinou v Iraku
  • Lingala, ktorú používa približne 45 miliónov ľudí v Konžskej demokratickej republike, Konžskej republike, Stredoafrickej republike, Angole a Juhosudánskej republike
  • Luganda, ktorú používa asi 20 miliónov ľudí v Ugande a Rwande
  • Maithili, ktorý používa asi 34 miliónov ľudí v severnej Indii
  • Meiteilon (Manipuri), ktorý používajú asi dva milióny ľudí v severovýchodnej Indii
  • Mizo, ktorý používa asi 830 000 ľudí v severovýchodnej Indii
  • Oromo, ktorý používa asi 37 miliónov ľudí v Etiópii a Keni
  • Quechua, ktorú používa asi 10 miliónov ľudí v Peru, Bolívii, Ekvádore a okolitých krajinách
  • Sanskrit, ktorý v Indii používa asi 20 000 ľudí
  • Sepedi, ktorý používa asi 14 miliónov ľudí v Južnej Afrike
  • Tigrinya, ktorú používa asi osem miliónov ľudí v Eritrei a Etiópii
  • Tsonga, ktorú používa asi sedem miliónov ľudí v Eswatini, Mozambiku, Južnej Afrike a Zimbabwe
  • Twi, ktorú v Ghane používa asi 11 miliónov ľudí

Isaac Caswell a Ankur Bapna, výskumní vedci pre Google Translate, napísali technický príspevok pre Blog Google AI podrobne o tom, ako fungujú ich nové nástroje na jednojazyčný preklad alebo „preklad s nulovými zdrojmi“. Je to technicky náročné, ale vysvetľuje, ako Google vytvoril súbory údajov pre 1138 jazykov, aby sa „naučil reprezentácie jazykov s nedostatočnými zdrojmi priamo z jednojazyčného textu“.

Prekladač Google prešiel za posledných pár rokov dlhou cestou. Najnovšie pixely ako napr Pixel 6 môcť Živý preklad hovorené slová alebo text prezeraný cez kameru z desiatok jazykov. teraz telefóny so systémom Android sa stanú užitočnejšími pre komunity na celom svete, ktoré boli historicky zaostalé technológiou zameranou len na niekoľko jazykov.

V iných jazykových správach Google IO Pichai poznamenal, že automaticky generované titulky YouTube sú teraz k dispozícii v 16 jazykoch.

instagram story viewer