Android Keskus

Google-kääntäjä lisää kaksi tusinaa yli 300 miljoonan ihmisen käyttämää kieltä

protection click fraud

Mitä sinun tarvitsee tietää

  • Google I/O 2022:n aikana Google ilmoitti, että Google Translate tukee 24 uutta kieltä.
  • Tämä on ensimmäinen kerta, kun Kääntäjä tukee alkuperäiskansojen amerikkalaisia ​​kieliä tai englannin murretta.
  • Google käyttää tyypillisesti kaksikielistä oppimista kielten kääntämiseen, mutta näille uusille kielille käytettiin yksikielistä oppimista.
  • Google-kääntäjä tukee nyt yhteensä 133 kieltä.

Tänään, aikana Google IO 2022 pääpuheenvuoron, Googlen toimitusjohtaja Sundar Pichai ilmoitti, että yritys tuo 24 uutta kieltä Google I/O: hon kohdentaen kieliä, jotka ovat "aliedustettuina verkossa nykyään".

"Yhä useammat ihmiset käyttävät Google Kääntäjää kuin koskaan ennen, mutta meillä on vielä tehtävää, jotta se olisi yleisesti saatavilla", Pichai sanoi.

Google-kääntäjä käyttää yleensä "kaksikielistä oppimista" kääntääkseen tekstiä ja vertaamalla kahden kielen lauseita eri lauseiden kääntämiseksi oikein. Mutta koska näillä uusilla kielillä on vähemmän tekstiä Googlen tekoälylle, se joutui luottamaan "yksikieliseen oppiminen", jossa "malli oppii kääntämään uuden kielen näkemättä koskaan datakäännöstä."

Google Translate esimerkkejä
(Kuvan luotto: Google)

Alla luetellut 24 kieltä kattavat noin 310 miljoonaa ihmistä ympäri maailmaa, ja niihin kuuluu kolme alkuperäiskansojen kieltä Amerikka (Quechua, Guarani ja Aymara) ja englannin murre (Sierra Leonean Krio), jotka kaikki ovat Googlelle ensimmäisiä Kääntää.

  • Assami, jota käyttää noin 25 miljoonaa ihmistä Koillis-Intiassa
  • Aymara, jota käyttää noin kaksi miljoonaa ihmistä Boliviassa, Chilessä ja Perussa
  • Bambara, jota käyttää noin 14 miljoonaa ihmistä Malissa
  • Bhojpuri, jota käyttää noin 50 miljoonaa ihmistä Pohjois-Intiassa, Nepalissa ja Fidžissä
  • Dhivehi, jota käyttää noin 300 000 ihmistä Malediiveilla
  • Dogri, jota käyttää noin kolme miljoonaa ihmistä Pohjois-Intiassa
  • Ewe, jota käyttää noin seitsemän miljoonaa ihmistä Ghanassa ja Togossa
  • Guarani, jota käyttää noin seitsemän miljoonaa ihmistä Paraguayssa ja Boliviassa, Argentiinassa ja Brasiliassa
  • Ilocano, jota käyttää noin 10 miljoonaa ihmistä Pohjois-Filippiineillä
  • Konkani, jota käyttää noin kaksi miljoonaa ihmistä Keski-Intiassa
  • Krio, jota käyttää noin neljä miljoonaa ihmistä Sierra Leonessa
  • Kurdi (sorani), jota käyttää noin kahdeksan miljoonaa ihmistä, enimmäkseen Irakissa
  • Lingala, jota käyttää noin 45 miljoonaa ihmistä Kongon demokraattisessa tasavallassa, Kongon tasavallassa, Keski-Afrikan tasavallassa, Angolassa ja Etelä-Sudanin tasavallassa
  • Luganda, jota käyttää noin 20 miljoonaa ihmistä Ugandassa ja Ruandassa
  • Maithili, jota käyttää noin 34 miljoonaa ihmistä Pohjois-Intiassa
  • Meiteilon (Manipuri), jota käyttää noin kaksi miljoonaa ihmistä Koillis-Intiassa
  • Mizo, jota käyttää noin 830 000 ihmistä Koillis-Intiassa
  • Oromo, jota käyttää noin 37 miljoonaa ihmistä Etiopiassa ja Keniassa
  • Kechua, jota käyttää noin 10 miljoonaa ihmistä Perussa, Boliviassa, Ecuadorissa ja ympäröivissä maissa
  • Sanskritia, jota käyttää noin 20 000 ihmistä Intiassa
  • Sepedi, jota käyttää noin 14 miljoonaa ihmistä Etelä-Afrikassa
  • Tigrinya, jota käyttää noin kahdeksan miljoonaa ihmistä Eritreassa ja Etiopiassa
  • Tsonga, jota käyttää noin seitsemän miljoonaa ihmistä Eswatinissa, Mosambikissa, Etelä-Afrikassa ja Zimbabwessa
  • Twi, jota käyttää noin 11 miljoonaa ihmistä Ghanassa

Isaac Caswell ja Ankur Bapna, Google Translate -tutkijat, kirjoittivat teknisen viestin Google AI -blogi yksityiskohtaisesti, kuinka heidän uudet yksikieliset käännöstyökalut tai "nollaresurssikäännös" toimivat. Se on teknisesti tiheä, mutta selittää, kuinka Google loi tietojoukkoja 1138 kielelle "oppiakseen esitykset aliresursseista kielistä suoraan yksikielisestä tekstistä".

Google-kääntäjä on edennyt pitkän tien viimeisten vuosien aikana. Viimeaikaiset pikselit, kuten Pixel 6 voi Live-kääntäjä puhutut sanat tai kameran läpi katsottu teksti kymmeniltä kieliltä. Nyt, Android-puhelimet tulee hyödyllisemmäksi yhteisöille eri puolilla maailmaa, jotka ovat historiallisesti jääneet vain muutamiin kieliin kohdistuvan teknologian jälkeen.

Muissa kieliin liittyvissä Google IO -uutisissa Pichai huomautti, että YouTuben automaattisesti luodut tekstitykset ovat nyt saatavilla 16 kielellä.

instagram story viewer