Artikel

Dit is hoe Google erin slaagt om Assistent te laten denken als een mens

protection click fraud

Google Assistent is uitgegroeid tot een eigen platform sinds de lancering. Het is niet alleen slimmer dan ooit, maar met apparaten zoals de Nest Hub of Nest Mini, het is niet langer alleen een onderdeel van Android.

Wanneer software groeit in mogelijkheden, wordt het natuurlijk ook complexer. Dat betekent dat ontwikkelaars speciale tools nodig hebben om de inhoud te bouwen die we willen gebruiken op onze smartdisplays en andere Assistant-apparaten. Zoals bij alle ontwikkelaarstools, zijn er twee belangrijke dingen die ze moeten doen: gebruiksvriendelijk zijn en goed werken. Het is moeilijk om beide belangrijke dingen te laten gebeuren, maar de release van het Actions Builder-webinterface en Actions SDK het lijkt erop dat ze winnaars zullen zijn.

Laat het gesprek stromen

Om een ​​Google Assistent-actie geweldig te laten zijn, moet deze kunnen praten en luisteren zoals een persoon dat zou doen. Als je je Google huis om je kinderen een verhaaltje voor het slapengaan te vertellen of het liedje "Brush Your Teeth" te zingen, moet het herkennen wat je wilt en kunnen doen wat er gevraagd wordt zonder een robot te zijn die alleen logica en orde volgt.

Verizon biedt de Pixel 4a aan voor slechts $ 10 / maand op nieuwe onbeperkte lijnen

De twee belangrijke dingen die dit mogelijk maken, worden conversatiestroom en natuurlijk taalbegrip genoemd. Zonder deze informatie zou Assistant niet kunnen communiceren op de manier waarop we ervan genieten.

"Ja", "ja" en "ja" betekenen allemaal hetzelfde. Dat soort gebrekkige menselijke logica moet je een computer leren.

Conversation flow is een vrij eenvoudig concept om te begrijpen, en het betekent letterlijk precies hoe het klinkt: de assistent moet klaar staan ​​om met je te praten wanneer je er iets tegen hebt gezegd. Dat is gemakkelijk als je het weer vraagt ​​of het zelfs vraagt ​​om een ​​liedje over tandenpoetsen te zingen, maar als het ingewikkeld wordt, kies bijvoorbeeld je een eigen avonturenspel bijvoorbeeld - er zijn een aantal zeer specifieke manieren waarop een gesprek moet worden gestuurd, zodat de Assistent een antwoord te geven heeft.

Dat is waar Natural Language Understanding (NLU) in beeld komt. De assistent moet dingen weten als "ja" en "ja" en "ja" allemaal hetzelfde betekenen en het moet herkennen hoe spraak vloeiend is; we praten allemaal heel anders dan we schrijven. En aangezien Assistant een computer is die zich alleen als een persoon gedraagt, moet dit allemaal worden ingevoerd in elk Conversational Action-project. Computers kunnen niet echt leren, ze moeten worden geprogrammeerd.

Dat is waar de nieuwe Actions Builder en Actions SDK van Google in het spel komen. Het zijn twee nieuwe tools waarmee ontwikkelaars een project van begin tot eind kunnen bouwen op de manier waarop ze zich het prettigst voelen. Actions Builder is een webgebaseerde tool waarmee ontwikkelaars Conversational Actions op dezelfde manier kunnen bouwen als een stroomschema. Maar het heeft dezelfde tools als een traditionele ontwikkelings-SDK. Elke ontwikkelaar kan deze grafische interface gebruiken om de gespreksstroom te visualiseren, alle NLU-gegevens invoeren die de project is getraind om het eindproduct te begrijpen en zelfs te debuggen in een handig en gemakkelijk te begrijpen manier.

Ontwikkelaars kunnen een webgebaseerde blokbouwer of een nieuwe IDE gebruiken om Assistant-inhoud te bouwen. Of ze kunnen beide gebruiken!

De Actions SDK doet hetzelfde, maar dan in een meer traditionele IDE (geïntegreerde ontwikkelomgeving) voor ontwikkelaars die liever lokaal werken of via een op bestanden gebaseerd overzicht van hun project. En als ontwikkelaars al een voorkeurs-IDE hebben, kunnen ze deze gebruiken in combinatie met opdrachtregeltools om het eindproduct te bouwen met dezelfde voordelen.

Deze tools zijn de voorkant van een beter en sneller Assistent-platform. De looptijd (denk aan de motor die de software aandrijft die we gebruiken) voor Assistant is nu sneller dan ooit tevoren, en een geheel nieuw interactiemodel betekent dat Assistant zowel slimmer als gemakkelijker te bouwen is voor.

Het nieuwe interactiemodel is zo gebouwd dat zaken als real-time gesprekken sneller en efficiënter kunnen worden gebouwd, en NLU-training is robuuster. Ontwikkelaars kunnen scènes maken en deze gebruiken als een bouwsteen waarbij elk onderdeel van een gespreksactie zijn eigen gegevens en logica heeft. Het beste van alles is dat ontwikkelaars scènes kunnen bouwen en deze in dezelfde actie kunnen hergebruiken met actieve intenties.

Jerry Hildenbrand

Jerry is de huisnerd van Mobile Nation en daar trots op. Er is niets dat hij niet uit elkaar kan halen, maar veel dingen kan hij niet weer in elkaar zetten. Je vindt hem op het Mobile Nations-netwerk en dat kan sla hem op Twitter als je hey wilt zeggen.

instagram story viewer