Articol

Iată cum Google reușește să-l facă pe Asistent să gândească ca un om

protection click fraud

Asistent Google a devenit o platformă proprie de când a fost lansat. Nu numai că este mai inteligent ca niciodată, ci cu dispozitive precum Nest Hub sau Nest Mini, nu mai este doar o parte din Android.

Desigur, atunci când software-ul crește în capabilități, devine, de asemenea, mai complex. Asta înseamnă că dezvoltatorii au nevoie de instrumente dedicate pentru a construi conținutul pe care dorim să îl folosim pe ecranele noastre inteligente și pe alte dispozitive compatibile cu Asistentul. La fel ca orice instrumente pentru dezvoltatori, există două lucruri importante pe care trebuie să le facă: să fie ușor de utilizat și să funcționeze bine. Este greu să faci ca ambele lucruri importante să se întâmple, dar lansarea Interfața web Actions Builder și SDK Actions se pare că vor fi câștigători.

Lasă conversația să curgă

Pentru ca o acțiune Google Assistant să fie excelentă, trebuie să poată vorbi și asculta așa cum ar face o persoană. Dacă vă întrebați Google Home pentru a le spune copiilor o poveste de culcare sau pentru a cânta melodia „Brush Your Teeth”, trebuie să recunoască ceea ce vrei și să poți face ceea ce ți se cere fără a fi un robot care urmează doar logica și ordinea.

Verizon oferă Pixel 4a la doar 10 USD / lună pe noile linii nelimitate

Cele două lucruri importante care fac din aceasta o realitate se numesc flux conversațional și înțelegerea limbajului natural. Fără acestea, Asistentul nu ar putea interacționa așa cum am ajuns să ne bucurăm.

„Da”, „da” și „da” înseamnă toate aceleași lucruri. Trebuie să înveți unui computer o astfel de logică umană defectuoasă.

Fluxul conversațional este un concept destul de ușor de înțeles și înseamnă literalmente exact cum sună: Asistentul trebuie să fie gata să vă vorbească ori de câte ori i-ați spus ceva. Este ușor când întrebi vremea sau chiar îi ceri să cânte un cântec despre spălatul dinților, dar când lucrurile devin complexe - cum ar fi propriul joc de aventură, de exemplu - există câteva moduri foarte specifice în care o conversație trebuie condusă, așa că Asistentul are un răspuns de dat.

Acolo apare înțelegerea limbajului natural (NLU). Asistentul trebuie să știe lucruri precum „da” și „da” și „da” toate înseamnă același lucru și trebuie să recunoască modul în care vorbirea este fluidă; vorbim cu toții foarte diferit decât scriem. Și întrucât Asistentul este un computer care acționează doar ca o persoană, toate acestea trebuie introduse în orice proiect de acțiune conversațională. Computerele nu pot învăța cu adevărat, trebuie să fie programate.

Acolo intră în joc noul Actions Builder și Actions SDK. Sunt două instrumente noi care permit dezvoltatorilor să construiască un proiect de la început până la sfârșit în modul în care se simt cel mai confortabil. Actions Builder este un instrument bazat pe web care permite dezvoltatorilor să construiască acțiuni conversaționale în același mod în care creați o diagramă de flux. Dar are aceleași instrumente ca un SDK de dezvoltare tradițional. Orice dezvoltator poate utiliza această interfață grafică pentru a vizualiza fluxul conversațional, pentru a introduce orice date NLU pe care proiectul a fost instruit să înțeleagă și chiar să depaneze produsul final într-un mod convenabil și ușor de înțeles cale.

Dezvoltatorii pot utiliza un constructor de blocuri bazat pe web sau un IDE nou pentru a crea conținut de asistent. Sau le pot folosi pe amândouă!

SDK-ul Actions face același lucru, dar într-un IDE (mediu de dezvoltare integrat) mai tradițional pentru dezvoltatorii care preferă să lucreze local sau printr-o imagine de ansamblu bazată pe fișiere a proiectului lor. Și dacă dezvoltatorii au deja un IDE preferat, îl pot folosi combinat cu instrumente din linia de comandă pentru a construi produsul final cu toate aceleași beneficii.

Aceste instrumente reprezintă partea frontală a unei platforme de asistent mai bune și mai rapide. Timpul de rulare (gândiți-vă la acesta ca la motorul care alimentează software-ul pe care îl folosim) pentru Asistent este acum mai rapid ca niciodată, iar un nou model de interacțiune înseamnă că Asistentul este atât mai inteligent, cât și mai ușor de construit pentru.

Noul model de interacțiune este construit, astfel încât lucrurile precum conversațiile în timp real sunt mai rapide și mai eficiente de construit, iar formarea NLU este mai robustă. Dezvoltatorii pot crea scene și le pot folosi ca element de construcție în care fiecare parte a unei acțiuni de conversație are propriile date și logică. Cel mai bine, dezvoltatorii pot construi scene și le pot refolosi în aceeași acțiune prin intenții active.

Jerry Hildenbrand

Jerry este tocilarul rezident al Mobile Nation și mândru de asta. Nu există nimic pe care să nu-l poată despărți, dar multe lucruri pe care nu le poate reasambla. Îl veți găsi în rețeaua Mobile Nations și puteți lovește-l pe Twitter dacă vrei să spui hei.

instagram story viewer