الروبوت المركزي

Google Gemini موجود هنا لتمهيد الطريق لنماذج الذكاء الاصطناعي في عام 2024 وما بعده

protection click fraud

ما تحتاج إلى معرفته

  • على الرغم من التقارير التي تفيد بتأخيره، فقد تم تقديم Google Gemini رسميًا.
  • يتكون نموذج الذكاء الاصطناعي هذا من ثلاثة "أحجام" مختلفة، بما في ذلك Gemini Nano وPro وUltra.
  • تم تصميم Gemini Nano للأجهزة المحمولة، بينما تم دمج Gemini Pro في Google Bard.
  • من المقرر أن يصل Gemini Ultra في وقت ما من العام المقبل، وسيكون جزءًا من "تجربة Bard Advanced" الجديدة.

انتهى الانتظار أخيرًا، حيث كشفت Google رسميًا عن منافسها الحقيقي ChatGPT مع Google Gemini. أعلن في مؤتمر جوجل آي/أو 2023، Gemini هو "نموذج الأساس للجيل التالي" للشركة، والذي يتكون من ثلاثة نماذج مختلفة: Ultra وPro وNano.

في حين أنه قد يبدو كما لو أن جوجل تحركت بسرعة لجلب نموذج الذكاء الاصطناعي الجديد الخاص بها إلى الجمهور، إلا أن هذا لا يمكن أن يكون أبعد عن الحقيقة. بمساعدة جوجل ديب مايند، تعمل شركة Gemini منذ عام 2012 قبل تكثيف التطوير في عام 2015 باستخدام مسرعات الذكاء الاصطناعي.

على عكس Bard، الذي كان مخيبًا للآمال عند مقارنته بأمثال ChatGPT وClaude، فإن Gemini يجلب منافسة حقيقية. من بين النماذج الثلاثة المختلفة، توفر Google نظرة عامة واسعة النطاق على ما يمكن أن يقدمه كل نموذج:

نظرة عامة متعددة الوسائط على Google Gemini Ultra وPro وNano
(حقوق الصورة: جوجل)
  • Gemini Nano: النموذج الأكثر كفاءة للمهام التي تتم على الجهاز.
  • Gemini Pro: أفضل نموذج للتوسع عبر مجموعة واسعة من المهام.
  • Gemini Ultra: النموذج الأكبر والأكثر قدرة على المهام المعقدة للغاية.

إذا قمنا بتفصيل الأمور قليلاً، فإن Gemini Nano هو ما سنراه يأتي إلى أفضل هواتف Android. لا يقتصر الأمر على فتح Gemini Nano للمطورين عبر AICoreولكن جوجل أكدت بالفعل أنها ستصل إلى بكسل 8 برو.

ومع ذلك، لا تتوقع وجود تطبيق مخصص للوصول إلى Gemini، حيث تنص Google على أنه "يعمل على تشغيل ميزات جديدة مثل Summarize في تطبيق Recorder ونشر الرد الذكي في Gboard، بدءًا من WhatsApp." ولكن بفضل قدرة المطورين على التنفيذ و"الإنشاء باستخدام Gemini Nano" من خلال AICore، نأمل ألا يمر وقت طويل قبل أن يأتي Nano إلى المزيد تطبيقات.

وبالتقدم خطوة، سيتم توفير Gemini Pro "للمطورين وعملاء المؤسسات" بدءًا من 13 ديسمبر. سيكون من الممكن الوصول إليه من خلال واجهة برمجة تطبيقات Gemini الجديدة الموجودة في Google AI Studio أو جوجل كلاود فيرتكس AI.

لحسن الحظ، لن نضطر إلى انتظار الفرصة للعب مع Gemini Pro. بدءًا من اليوم، تم تطبيق Gemini Pro في جوجل بارد "للمطالبات النصية، مع دعم الطرائق الأخرى قريبًا." حاليا، Bard مع Gemini Pro هو فقط متاح في 170 دولة، لكن جوجل تخطط للتوسع في المزيد من المناطق وبالمزيد من اللغات "في القريب مستقبل."

عرض بطل Google Gemini متعدد الوسائط
(حقوق الصورة: جوجل)

لقد تم التركيز كثيرًا على Gemini Pro، حيث تدعي Google أنه "أفضل نموذج للتوسع عبر مجموعة واسعة من المهام". تشير إحدى الدراسات التي قدمتها Google إلى أن Gemini Pro كان قادرًا على ذلك يتفوق على GPT-3.5 "في ستة من أصل ثمانية معايير." على الرغم من أنه مثير للإعجاب، إلا أنه يتعين علينا أيضًا أن نتساءل عما إذا كان سيتم تحسينه ليتجاوز GPT-3.5 أو ما إذا كان التركيز الأساسي سيكون على Nano و فائقة.

عند الحديث عن ذلك، يمكن القول إن Gemini Ultra هو النموذج الأكثر إثارة في المجموعة، لأنه "النموذج الأكثر قدرة". ومع ذلك، فإننا سوف يتعين علينا الانتظار لفترة أطول قليلاً قبل أن نضع أيدينا على Ultra، حيث تقوم Google حاليًا "باستكمال عمليات التحقق الشاملة من الثقة والسلامة".

سيأتي برنامج Gemini Ultra أولاً "لاختيار العملاء والمطورين والشركاء وخبراء السلامة والمسؤولية لإجراء التجارب المبكرة وإبداء التعليقات قبل طرحه للمطورين و عملاء المؤسسات في أوائل العام المقبل." ولكن هناك شيء آخر يثير الحماس، حيث من المتوقع أن يتم تطبيق Ultra في "تجربة Bard Advanced" الجديدة، والتي من المتوقع أن تصل مبكرًا العام القادم.

معايير Google Gemini للنص والترميز مقارنةً بـ OpenAI's GPT-4
(حقوق الصورة: جوجل)

جزء مما يجعل Gemini Ultra مثيرًا للاهتمام هو مدى قوتها. تذكر Google أن Ultra هو "النموذج الأول الذي يتفوق فيه على الخبراء البشريين MMLU (فهم لغة متعدد المهام الهائل)، والذي يستخدم مزيجًا من 57 موضوعًا مثل الرياضيات، الفيزياء والتاريخ والقانون والطب والأخلاق لاختبار المعرفة العالمية وحل المشكلات قدرات." 

كيف فعلت هذا؟ وذلك بحصوله على درجة 90%، وهي أعلى من الدرجة المحسوبة التي حققتها والتي بلغت 86.4% نموذج OpenAI GPT-4. تفوقت شركة Gemini على GPT-4 في كل فئة باستثناء معيار "HellaSwag"، والذي يوصف بأنه "الاستدلال المنطقي للمهام اليومية".

إذا لم يكن الأمر واضحًا بما فيه الكفاية حتى الآن، فإن Google Bard كان مجرد حل مؤقت حيث واصلت الشركة تطوير Gemini إلى حد توفير إصدار عام. لكن Bard يعمل أيضًا كنقطة وصول بيننا وبين Gemini، حيث يمكنك البدء في استخدام Bard مع Gemini Pro اليوم.

للمساعدة في توفير القليل من المرح وإظهار ما يستطيع Bard مع Gemini Pro القيام به، عقدت Google شراكة مع مستخدم YouTube Mark Rober. في ال فيديو، يستخدم روبرت بارد للتوصل إلى بعض أفكار الفيديو، مما أدى إلى عمل روبرت على إنشاء "الطائرة الورقية الأكثر دقة في العالم".

من هناك، يتم استخدام Bard لإنشاء "هياكل القصة"، والتي يشرع روبرت بعد ذلك في اتباعها. في كل قسم، لا يعتمد Bard فقط على المطالبات النصية، حيث يلتقط Rober صورًا لتصميمات الطائرات الورقية المختلفة ويطلب من Bard تحليلها لتحديد الأفضل.

بعد اكتشاف التصميم الأكثر دقة للطائرة الورقية، يتم استخدام بارد بعد ذلك "لنقد" التصميم. ينشر بارد النتائج التي توصل إليها بينما يقدم أيضًا بعض الاقتراحات، مثل "الأجنحة صغيرة جدًا" و"الورقة كبيرة جدًا" ضوء." ومن هناك، يأخذ روبرت بنصيحة بارد، ويعرض طرق الاختبار المختلفة التي تم اتخاذها قبل الحدث الكبير النهاية.

على الرغم من أن الفيديو التشويقي رائع، إلا أنه ليس بالضبط المثال المثالي لما يمكننا تجربته بارد مع الجوزاء برو اليوم. ومع ذلك، فهو يعطينا لمحة عن الصورة الأكبر لما نأمل أن يكون ممكنًا بمجرد إتاحة Bard Advanced مع Gemini Ultra.

ومع ذلك، من المنعش أن نرى برج الجوزاء يظهر لأول مرة رسميًا قبل أن نقلب التقويم إلى عام 2024. من المحتمل أن يكون هذا الإعلان أكبر شيء يحدث لشركة Google في السنوات العشر الماضية. الآن، علينا فقط أن نأمل أن يتمكن Bard with Gemini من الارتقاء إلى مستوى الضجيج.

instagram story viewer