אנדרואיד מרכזי

Google Translate מוסיף שני תריסר שפות המשמשות יותר מ-300 מיליון אנשים

protection click fraud

מה שאתה צריך לדעת

  • במהלך Google I/O 2022, גוגל הודיעה ש-Google Translate יתמוך ב-24 שפות חדשות.
  • זו הפעם הראשונה ששפות ילידים אמריקאים או ניב אנגלי נתמכים ב-Translate.
  • Google משתמשת בדרך כלל בלמידה דו-לשונית כדי לתרגם שפות, אך השתמשה בלמידה חד-לשונית עבור השפות החדשות הללו.
  • 133 שפות בסך הכל נתמכות כעת ב-Google Translate.

היום, במהלך ה Google IO 2022 בנאום המרכזי, מנכ"ל גוגל, סונדאר פיצ'אי, הודיע ​​שהחברה תביא 24 שפות חדשות ל-Google I/O, תוך מיקוד לשפות ש"היום מיוצגות בחסר באינטרנט".

"יותר אנשים משתמשים ב-Google Translate מאי פעם, אבל עדיין יש לנו עבודה לעשות כדי להפוך אותו לנגיש אוניברסלית", אמר פיצ'אי.

Google Translate מסתמך בדרך כלל על "למידה דו-לשונית" לתרגום טקסט, ומשווה ביטויים בין שתי שפות כדי לתרגם נכון ביטויים שונים. אבל מכיוון שלשפות החדשות הללו יש פחות טקסט ל-AI של גוגל להתעמק בו, היא נאלצה להסתמך על "חד לשוני למידה", שבו "המודל לומד לתרגם שפה חדשה מבלי לראות אי פעם תרגום נתונים שלה".

דוגמאות של Google Translate
(קרדיט תמונה: גוגל)

24 השפות המפורטות להלן מכסות כ-310 מיליון אנשים ברחבי העולם, וכוללות שלוש שפות ילידיות של אמריקה (קצ'ואה, גוארני ואימארה) ודיאלקט אנגלי (סיירה לאוניאן קריו), כולם ראשונים עבור גוגל לתרגם.

  • אסאמית, בשימוש על ידי כ-25 מיליון אנשים בצפון מזרח הודו
  • איימארה, המשמשת כשני מיליון בני אדם בבוליביה, צ'ילה ופרו
  • במברה, המשמשת כ-14 מיליון בני אדם במאלי
  • בהוג'פורי, בשימוש של כ-50 מיליון בני אדם בצפון הודו, נפאל ופיג'י
  • Dhivehi, בשימוש על ידי כ-300,000 אנשים באיים המלדיביים
  • דוגרי, בשימוש כשלושה מיליון אנשים בצפון הודו
  • איווה, בשימוש על ידי כשבעה מיליון אנשים בגאנה ובטוגו
  • גוארני, בשימוש של כשבעה מיליון אנשים בפרגוואי ובבוליביה, ארגנטינה וברזיל
  • Ilocano, בשימוש על ידי כ-10 מיליון אנשים בצפון הפיליפינים
  • Konkani, בשימוש על ידי כשני מיליון אנשים במרכז הודו
  • קריו, בשימוש על ידי כארבעה מיליון אנשים בסיירה לאון
  • כורדית (סוראני), בשימוש כשמונה מיליון בני אדם, בעיקר בעיראק
  • לינגלה, בשימוש על ידי כ-45 מיליון אנשים ברפובליקה הדמוקרטית של קונגו, הרפובליקה של קונגו, הרפובליקה המרכז אפריקאית, אנגולה והרפובליקה של דרום סודן
  • לוגנדה, המשמשת כ-20 מיליון אנשים באוגנדה ורואנדה
  • מאיתילי, בשימוש על ידי כ-34 מיליון בני אדם בצפון הודו
  • Meiteilon (Manipuri), בשימוש על ידי כשני מיליון אנשים בצפון מזרח הודו
  • מיזו, בשימוש על ידי כ-830,000 אנשים בצפון מזרח הודו
  • אורומו, בשימוש על ידי כ-37 מיליון אנשים באתיופיה ובקניה
  • קצ'ואה, המשמשת כ-10 מיליון בני אדם בפרו, בוליביה, אקוודור ובמדינות הסובבות אותה
  • סנסקריט, בשימוש על ידי כ-20,000 אנשים בהודו
  • Sepedi, בשימוש על ידי כ-14 מיליון אנשים בדרום אפריקה
  • טיגרינה, המשמשת כשמונה מיליון בני אדם באריתריאה ובאתיופיה
  • צונגה, בשימוש על ידי כשבעה מיליון אנשים באסווטיני, מוזמביק, דרום אפריקה וזימבבואה
  • Twi, בשימוש על ידי כ-11 מיליון אנשים בגאנה

אייזק קאסוול ואנקור בפנה, מדעני מחקר עבור גוגל טרנסלייט, כתבו פוסט טכני עבור בלוג בינה מלאכותית של גוגל המפרט כיצד פועלים הכלים החדשים של התרגום החד-לשוני שלהם, או "תרגום אפס משאבים". זה צפוף מבחינה טכנית, אבל מסביר כיצד גוגל יצרה מערכי נתונים עבור 1138 שפות כדי "ללמוד ייצוגים של שפות חסרות משאבים ישירות מטקסט חד לשוני".

Google Translate עבר דרך ארוכה בשנים האחרונות. פיקסלים אחרונים כמו פיקסל 6 פחית תרגום חי מילים מדוברות או טקסט הנצפים דרך מצלמה מעשרות שפות. עַכשָׁיו, טלפונים אנדרואיד יהפוך שימושי יותר עבור קהילות ברחבי העולם אשר היסטורית נותרו מאחור על ידי טכנולוגיה המכוונת רק לכמה שפות.

בחדשות אחרות הקשורות לשפה של Google IO, פיצ'אי ציין שהכתוביות שנוצרו אוטומטית של YouTube זמינות כעת ב-16 שפות.

instagram story viewer