مقالة سلعة

إليك كيفية نجاح Google في جعل المساعد يفكر مثل الإنسان

protection click fraud

مساعد جوجل نمت لتصبح منصتها الخاصة منذ إطلاقها. ليس فقط أنه أذكى من أي وقت مضى ، ولكن مع أجهزة مثل Nest Hub أو عش ميني، لم يعد مجرد جزء من Android.

بالطبع ، عندما تنمو قدرات البرامج ، فإنها تصبح أيضًا أكثر تعقيدًا. هذا يعني أن المطورين يحتاجون إلى أدوات مخصصة لبناء المحتوى الذي نريد استخدامه على شاشاتنا الذكية والأجهزة الأخرى التي تدعم المساعد. مثل أي أدوات للمطورين ، هناك شيئان مهمان يتعين عليهم القيام بهما: أن يكون سهل الاستخدام ويعمل بشكل جيد. من الصعب إجراء هذين الأمرين المهمين ، ولكن إصدار ملف واجهة الويب لـ Actions Builder و Actions SDK يبدو أنهم سيكونون فائزين.

دع المحادثة تتدفق

لكي يكون إجراء مساعد Google رائعًا ، يجب أن تكون قادرًا على التحدث والاستماع كما يفعل أي شخص. إذا سألت الخاص بك بيت جوجل لتخبر أطفالك قصة ما قبل النوم أو تغني أغنية "Brush Your Teeth" ، يجب أن تتعرف على ما تريد وأن تكون قادرًا على القيام بما هو مطلوب دون أن يكون روبوتًا يتبع المنطق والنظام فقط.

تقدم Verizon Pixel 4a مقابل 10 دولارات شهريًا فقط على خطوط جديدة غير محدودة

يُطلق على الشيئين المهمين اللذين يجعلان ذلك حقيقة واقعة تدفق المحادثة وفهم اللغة الطبيعية. بدون ذلك ، لن يتمكن المساعد من التفاعل بالطريقة التي نتمتع بها.

"نعم" و "نعم" و "نعم" كلها تعني نفس الشيء. عليك تعليم جهاز كمبيوتر هذا النوع من المنطق البشري الخاطئ.

يعد تدفق المحادثة مفهومًا سهل الفهم ، ويعني حرفيًا ما يبدو عليه بالضبط: يحتاج المساعد إلى أن يكون جاهزًا للتحدث معك كلما قلت شيئًا له. هذا سهل عندما تسأل عن الطقس أو تطلب منه أن تغني أغنية عن تنظيف الأسنان بالفرشاة ، ولكن عندما تصبح الأمور معقدة - مثل اختيار لعبة المغامرة الخاصة ، على سبيل المثال - هناك بعض الطرق المحددة جدًا التي يجب توجيه المحادثة بها حتى يكون لدى المساعد إجابة لتقديمها.

هذا هو المكان الذي يأتي فيه فهم اللغة الطبيعية (NLU) في الصورة. يحتاج المساعد إلى معرفة أشياء مثل "نعم" و "نعم" و "نعم" كلها تعني نفس الشيء ويحتاج إلى التعرف على مدى مرونة الكلام ؛ نتحدث جميعًا بشكل مختلف تمامًا عما نكتب. ونظرًا لأن المساعد عبارة عن كمبيوتر يعمل فقط كشخص ، فإن كل هذا يحتاج إلى إدخاله في أي مشروع إجراء محادثة. لا يمكن لأجهزة الكمبيوتر أن تتعلم حقًا ، فهي بحاجة إلى برمجتها.

هذا هو المكان الذي تدخل فيه أداة Google Actions Builder و Actions SDK الجديدة. هما أداتان جديدتان تسمحان للمطورين ببناء مشروع من البداية إلى النهاية بالطريقة الأكثر راحة لهم. منشئ الإجراءات عبارة عن أداة قائمة على الويب تتيح للمطورين إنشاء إجراءات محادثة بنفس الطريقة التي تنشئ بها مخطط تدفق. ولكن لديها نفس الأدوات التي توفرها SDK للتطوير التقليدي. يمكن لأي مطور استخدام هذه الواجهة الرسومية لتصور تدفق المحادثة ، وإدخال أي بيانات NLU التي يحتوي عليها تم تدريب المشروع على فهم المنتج النهائي ، وحتى تصحيحه بطريقة مريحة وسهلة الفهم الطريق.

يمكن للمطورين استخدام أداة إنشاء كتل تستند إلى الويب أو IDE جديد لبناء محتوى المساعد. أو يمكنهم استخدام كليهما!

يقوم Actions SDK بنفس الشيء ولكن في بيئة تطوير متكاملة (IDE) تقليدية أكثر للمطورين الذين يفضلون العمل محليًا أو من خلال نظرة عامة قائمة على الملفات لمشروعهم. وإذا كان المطورون لديهم بالفعل IDE مفضل ، فيمكنهم استخدامه مع أدوات سطر الأوامر لبناء المنتج النهائي بنفس الفوائد.

هذه الأدوات هي الواجهة الأمامية لمنصة مساعد أفضل وأسرع. أصبح وقت التشغيل (فكر في ذلك على أنه المحرك الذي يشغل البرنامج الذي نستخدمه) لـ Assistant الآن أسرع من أي وقت مضى ، ويعني نموذج التفاعل الجديد تمامًا أن المساعد أكثر ذكاءً وأسهل في الإنشاء إلى عن على.

تم تصميم نموذج التفاعل الجديد بحيث تكون أشياء مثل المحادثات في الوقت الفعلي أسرع وأكثر كفاءة في البناء ، ويكون تدريب NLU أكثر قوة. يمكن للمطورين إنشاء مشاهد واستخدامها باعتبارها لبنة بناء حيث يكون لكل جزء من إجراء المحادثة بياناته ومنطقه الخاص. وأفضل ما في الأمر هو أنه يمكن للمطورين إنشاء مشاهد وإعادة استخدامها في نفس الإجراء من خلال نوايا نشطة.

جيري هيلدنبراند

جيري هو الطالب الذي يذاكر كثيرا المقيم في Mobile Nation ويفتخر به. لا يوجد شيء لا يستطيع تفكيكه ، لكن هناك أشياء كثيرة لا يمكنه إعادة تجميعها. ستجده عبر شبكة Mobile Nations ويمكنك ذلك ضربه على تويتر إذا كنت تريد أن تقول مرحبًا.

instagram story viewer