Android Central

Google Translate lägger till två dussin språk som används av över 300 miljoner människor

protection click fraud

Vad du behöver veta

  • Under Google I/O 2022 meddelade Google att Google Translate skulle stödja 24 nya språk.
  • Det är första gången inhemska amerikanska språk eller en engelsk dialekt har stöds på Translate.
  • Google använder vanligtvis tvåspråkig inlärning för att översätta språk, men använde enspråkig inlärning för dessa nya språk.
  • Totalt stöds nu 133 språk på Google Translate.

Idag, under Google IO 2022 huvudtal, Googles vd Sundar Pichai meddelade att företaget skulle ta med 24 nya språk till Google I/O, inriktat på språk som är "underrepresenterade på webben idag."

"Fler människor använder Google Översätt än någonsin tidigare, men vi har fortfarande arbete att göra för att göra det allmänt tillgängligt", sa Pichai.

Google Translate förlitar sig vanligtvis på "tvåspråkig inlärning" för att översätta text, jämföra fraser mellan två språk för att korrekt översätta olika fraser. Men eftersom dessa nya språk har mindre text för Googles AI att fördjupa sig i, var den tvungen att förlita sig på "enspråkig lärande", där "modellen lär sig att översätta ett nytt språk utan att någonsin se en dataöversättning av det."

Exempel på Google Translate
(Bildkredit: Google)

De 24 språk som listas nedan täcker cirka 310 miljoner människor över hela världen och inkluderar tre inhemska språk i Amerika (Quechua, Guarani och Aymara) och en engelsk dialekt (Sierra Leonean Krio), som alla är de första för Google Översätt.

  • Assamese, som används av cirka 25 miljoner människor i nordöstra Indien
  • Aymara, som används av cirka två miljoner människor i Bolivia, Chile och Peru
  • Bambara, som används av cirka 14 miljoner människor i Mali
  • Bhojpuri, som används av cirka 50 miljoner människor i norra Indien, Nepal och Fiji
  • Dhivehi, som används av cirka 300 000 människor på Maldiverna
  • Dogri, som används av cirka tre miljoner människor i norra Indien
  • Tacka, som används av cirka sju miljoner människor i Ghana och Togo
  • Guarani, som används av cirka sju miljoner människor i Paraguay och Bolivia, Argentina och Brasilien
  • Ilocano, som används av cirka 10 miljoner människor i norra Filippinerna
  • Konkani, som används av cirka två miljoner människor i centrala Indien
  • Krio, som används av cirka fyra miljoner människor i Sierra Leone
  • Kurdiska (Sorani), som används av cirka åtta miljoner människor, mestadels i Irak
  • Lingala, som används av cirka 45 miljoner människor i Demokratiska republiken Kongo, Republiken Kongo, Centralafrikanska republiken, Angola och Sydsudan
  • Luganda, som används av cirka 20 miljoner människor i Uganda och Rwanda
  • Maithili, som används av cirka 34 miljoner människor i norra Indien
  • Meiteilon (Manipuri), som används av cirka två miljoner människor i nordöstra Indien
  • Mizo, som används av cirka 830 000 människor i nordöstra Indien
  • Oromo, som används av cirka 37 miljoner människor i Etiopien och Kenya
  • Quechua, som används av cirka 10 miljoner människor i Peru, Bolivia, Ecuador och omgivande länder
  • Sanskrit, som används av cirka 20 000 människor i Indien
  • Sepedi, som används av cirka 14 miljoner människor i Sydafrika
  • Tigrinya, som används av cirka åtta miljoner människor i Eritrea och Etiopien
  • Tsonga, som används av cirka sju miljoner människor i Eswatini, Moçambique, Sydafrika och Zimbabwe
  • Twi, som används av cirka 11 miljoner människor i Ghana

Isaac Caswell och Ankur Bapna, forskare för Google Translate, skrev ett tekniskt inlägg för Google AI-blogg beskriver hur deras nya enspråkiga översättningsverktyg, eller "noll-resursöversättning", fungerar. Det är tekniskt tätt, men förklarar hur Google skapade datauppsättningar för 1 138 språk för att "lära sig representationer av språk som saknar resurser direkt från enspråkig text."

Google Translate har kommit långt under de senaste åren. Senaste pixlar som Pixel 6 burk Live Translate talade ord eller text sedd genom en kamera från dussintals språk. Nu, Android-telefoner kommer att bli mer användbar för samhällen över hela världen som historiskt sett har lämnats på efterkälken av teknik som bara riktar sig till ett fåtal språk.

I andra språkrelaterade Google IO-nyheter noterade Pichai att YouTubes automatiskt genererade bildtexter nu är tillgängliga på 16 språk.

instagram story viewer