Android Centrála

Překladač Google přidává dvě desítky jazyků, které používá více než 300 milionů lidí

protection click fraud

Co potřebuješ vědět

  • Během Google I/O 2022 Google oznámil, že Google Translate bude podporovat 24 nových jazyků.
  • Je to poprvé, co jsou v Překladači podporovány domorodé americké jazyky nebo anglický dialekt.
  • Google k překladu jazyků obvykle používá dvojjazyčné učení, ale u těchto nových jazyků použil jednojazyčné učení.
  • Překladač Google nyní podporuje celkem 133 jazyků.

Dnes, během Google IO 2022 hlavní projev, generální ředitel společnosti Google Sundar Pichai oznámil, že společnost přinese na Google I/O 24 nových jazyků se zaměřením na jazyky, které jsou „dnes na webu nedostatečně zastoupeny“.

„Překladač Google používá více lidí než kdykoli předtím, ale stále máme co dělat, abychom jej zpřístupnili všem,“ řekl Pichai.

Překladač Google se při překladu textu obvykle spoléhá na „dvojjazyčné učení“ a porovnává fráze mezi dvěma jazyky, aby správně přeložil různé fráze. Ale protože tyto nové jazyky mají méně textu, do kterého by se umělá inteligence Google mohla ponořit, musela se spolehnout na „jednojazyčné learning," kde se "model učí překládat nový jazyk, aniž by kdy viděl jeho datový překlad."

Příklady Překladače Google
(Obrazový kredit: Google)

Níže uvedených 24 jazyků pokrývá asi 310 milionů lidí na celém světě a zahrnuje tři domorodé jazyky Amerika (Quechua, Guarani a Aymara) a anglický dialekt (Sierra Leonean Krio), z nichž všechny jsou pro Google první Přeložit.

  • ásámština, kterou používá asi 25 milionů lidí v severovýchodní Indii
  • Aymara, kterou používají asi dva miliony lidí v Bolívii, Chile a Peru
  • Bambara, kterou v Mali používá asi 14 milionů lidí
  • Bhojpuri, kterou používá asi 50 milionů lidí v severní Indii, Nepálu a na Fidži
  • Dhivehi, kterou na Maledivách používá asi 300 000 lidí
  • Dogri, kterou v severní Indii používají asi tři miliony lidí
  • Ewe, kterou používá asi sedm milionů lidí v Ghaně a Togu
  • Guarani, kterou používá asi sedm milionů lidí v Paraguayi a Bolívii, Argentině a Brazílii
  • Ilocano, kterou používá asi 10 milionů lidí na severu Filipín
  • Konkani, kterou používají asi dva miliony lidí ve střední Indii
  • Krio, který v Sierra Leone používají asi čtyři miliony lidí
  • Kurdština (Sorani), kterou používá asi osm milionů lidí, převážně v Iráku
  • Lingala, kterou používá asi 45 milionů lidí v Demokratické republice Kongo, Republice Kongo, Středoafrické republice, Angole a Republice Jižní Súdán
  • Luganda, kterou používá asi 20 milionů lidí v Ugandě a Rwandě
  • Maithili, které v severní Indii používá asi 34 milionů lidí
  • Meiteilon (Manipuri), který používají asi dva miliony lidí v severovýchodní Indii
  • Mizo, kterou používá asi 830 000 lidí v severovýchodní Indii
  • Oromo, který používá asi 37 milionů lidí v Etiopii a Keni
  • Quechua, kterou používá asi 10 milionů lidí v Peru, Bolívii, Ekvádoru a okolních zemích
  • Sanskrit, který v Indii používá asi 20 000 lidí
  • Sepedi, kterou v Jižní Africe používá asi 14 milionů lidí
  • Tigrinya, kterou používá asi osm milionů lidí v Eritreji a Etiopii
  • Tsonga, kterou používá asi sedm milionů lidí v Eswatini, Mosambiku, Jižní Africe a Zimbabwe
  • Twi, kterou v Ghaně používá asi 11 milionů lidí

Isaac Caswell a Ankur Bapna, výzkumní vědci pro Google Translate, napsali technický příspěvek pro Blog Google AI podrobně popisující, jak fungují jejich nové nástroje pro jednojazyčný překlad neboli „překlad s nulovými zdroji“. Je to technicky obsáhlé, ale vysvětluje, jak Google vytvořil datové sady pro 1138 jazyků, aby se „naučil reprezentace jazyků s nedostatečnými zdroji přímo z jednojazyčného textu“.

Překladač Google ušel za posledních několik let dlouhou cestu. Nedávné pixely jako Pixel 6 umět Živý překlad mluvená slova nebo text prohlížený kamerou z desítek jazyků. Nyní, telefony se systémem Android se stane užitečnější pro komunity po celém světě, které byly historicky opuštěny technologií zaměřenou pouze na několik jazyků.

V dalších jazykových zprávách Google IO Pichai poznamenal, že automaticky generované titulky YouTube jsou nyní k dispozici v 16 jazycích.

instagram story viewer