Artikkel

Slik lykkes Google med å få Assistent til å tenke som et menneske

protection click fraud

Google Assistant har vokst til sin egen plattform siden den ble lansert. Ikke bare er det smartere enn noensinne, men med enheter som Nest Hub eller Nest Mini, det er ikke lenger bare en del av Android.

Selvfølgelig, når programvaren vokser i evner, blir den også mer kompleks. Det betyr at utviklere trenger dedikerte verktøy for å bygge innholdet vi vil bruke på våre smarte skjermer og andre assistentaktiverte enheter. Som alle utviklerverktøy er det to viktige ting de trenger å gjøre: være enkle å bruke og fungere bra. Det er vanskelig å få begge disse viktige tingene til å skje, men utgivelsen av Actions Builder webgrensesnitt og Actions SDK ser ut som de blir vinnere.

La samtalen flyte

For at en Google Assistant-handling skal være bra, må den kunne snakke og lytte som en person ville gjort. Hvis du spør din Google Hjem for å fortelle barna en historie før leggetid eller synge "Brush Your Teeth" -sangen, må den gjenkjenne hva du vil og være i stand til å gjøre det som blir spurt uten å være en robot som bare følger logikk og orden.

Verizon tilbyr Pixel 4a for bare $ 10 per måned på nye ubegrensede linjer

De to viktige tingene som gjør dette til en realitet kalles samtalestrøm og naturlig språkforståelse. Uten disse ville ikke assistenten kunne samhandle slik vi har likt.

"Ja", "ja" og "jepp" betyr alle det samme. Du må lære en datamaskin den slags feil menneskelig logikk.

Samtalestrøm er et ganske enkelt begrep å forstå, og det betyr bokstavelig talt nøyaktig hvordan det høres ut: Assistent må være klar til å snakke tilbake til deg når du har sagt noe til det. Det er enkelt når du spør om været eller til og med ber det om å synge en sang om tannpuss, men når ting blir komplekse - som en velg din eget eventyrspill, for eksempel - det er noen veldig spesifikke måter en samtale må styres på, slik at assistenten har et svar å gi.

Det er her naturlig språkforståelse (NLU) kommer inn i bildet. Assistenten trenger å vite ting som "yeah" og "yep" og "yes" betyr alle det samme, og det må gjenkjenne hvordan tale er flytende; vi snakker alle veldig annerledes enn vi skriver. Og siden assistenten er en datamaskin som bare fungerer som en person, må alt dette legges inn i ethvert samtaleprosjekt. Datamaskiner kan egentlig ikke lære, de må programmeres.

Det er her Googles nye Actions Builder og Actions SDK kommer til spill. De er to nye verktøy som lar utviklere bygge et prosjekt fra start til slutt slik de er mest komfortable med. Actions Builder er et nettbasert verktøy som lar utviklere bygge Conversational Actions på samme måte som du bygger et flytdiagram. Men den har de samme verktøyene som en tradisjonell utvikling SDK ville. Enhver utvikler kan bruke dette grafiske grensesnittet til å visualisere samtalestrømmen, legge inn eventuelle NLU-data som prosjektet har blitt opplært til å forstå, og til og med feilsøke det endelige produktet på et praktisk og lett å forstå vei.

Utviklere kan bruke en nettbasert blokkbygger eller en ny IDE for å bygge assistentinnhold. Eller de kan bruke begge deler!

Actions SDK gjør det samme, men i et mer tradisjonelt IDE (integrert utviklingsmiljø) for utviklere som foretrekker å jobbe lokalt eller gjennom en filbasert oversikt over prosjektet sitt. Og hvis utviklere allerede har en foretrukket IDE, kan de bruke den kombinert med kommandolinjeverktøy for å bygge det endelige produktet med alle de samme fordelene.

Disse verktøyene er frontenden til en bedre og raskere assistentplattform. Kjøretiden (tenk på det som motoren som driver programvaren vi bruker) for Assistant er nå raskere enn noen gang før, og en helt ny interaksjonsmodell betyr at assistenten er både smartere og enklere å bygge til.

Den nye interaksjonsmodellen er bygget slik at ting som sanntidssamtaler er raskere og mer effektive å bygge, og NLU-opplæring er mer robust. Utviklere kan lage scener og bruke dem som en byggestein der hver del av en samtaleaksjon har sine egne data og logikk. Best av alt, utviklere kan bygge scener og gjenbruke dem i samme handling gjennom aktive hensikter.

Jerry Hildenbrand

Jerry er Mobile Nation's bosatt nerd og stolt av det. Det er ingenting han ikke kan ta fra hverandre, men mange ting han ikke kan sette sammen igjen. Du finner ham på tvers av Mobile Nations-nettverket, og du kan slo ham på Twitter hvis du vil si hei.

instagram story viewer