Член

Ето как Google успява да накара Асистент да мисли като човек

protection click fraud

Google Assistant от своя старт се превърна в собствена платформа. Той не само е по-умен от всякога, но и с устройства като Nest Hub или Nest Mini, това вече не е само част от Android.

Разбира се, когато софтуерът нараства във възможностите си, той също става по-сложен. Това означава, че разработчиците се нуждаят от специални инструменти за изграждане на съдържанието, което искаме да използваме на нашите интелигентни дисплеи и други устройства с активиран помощник. Както всеки инструмент за разработчици, има две важни неща, които трябва да направят: да бъдат лесни за използване и да работят добре. Трудно е да се случат и двете важни неща, но пускането на Уеб интерфейс на Action Builder и SDK за действия изглежда, че ще бъдат победители.

Оставете разговора да тече

За да бъде Google Assistant Action страхотно, трябва да може да говори и слуша, както би го направил човек. Ако попитате вашия Начална страница на Google за да разкажете на децата си история за лягане или да изпеете песента „Brush Your Teeth“, тя трябва да разпознае какво искате и да може да изпълнява това, което е поискано, без да е робот, който следва само логиката и реда.

Verizon предлага Pixel 4a само за $ 10 / месец на нови неограничени линии

Двете важни неща, които превръщат това в реалност, се наричат ​​разговорен поток и разбиране на естествения език. Без тях Асистент не би могъл да взаимодейства по начина, по който сме се насладили.

„Да“, „да“ и „да“ означават едно и също нещо. Трябва да научите компютър на такъв вид опорочена човешка логика.

Разговорният поток е доста лесна за разбиране концепция и буквално означава точно как звучи: Асистентът трябва да е готов да ви отговори винаги, когато сте му казали нещо. Това е лесно, когато питате времето или дори го помолите да изпее песен за миенето на зъбите, но когато нещата станат сложни - като изберете собствена приключенска игра, например - има няколко много специфични начина, по които трябва да се управлява разговорът, така че Асистент да има отговор.

Това е мястото, където разбираме естествения език (NLU). Асистентът трябва да знае неща като „да“ и „да“ и „да“, всички означават едно и също и той трябва да разпознава как речта е течна; всички говорим много по-различно, отколкото пишем. И тъй като Асистент е компютър, който действа само като човек, всичко това трябва да бъде включено във всеки проект за разговорно действие. Компютрите наистина не могат да се учат, те трябва да бъдат програмирани.

Тук влизат в действие новите Action Builder на Google и Action SDK. Те са два нови инструмента, които позволяват на разработчиците да изградят проект от началото до края по начина, по който им е най-удобно. Action Builder е уеб-базиран инструмент, който позволява на разработчиците да изграждат Разговорни действия по същия начин, по който изграждате диаграма. Но той има същите инструменти, които би имал традиционният SDK за разработка. Всеки разработчик може да използва този графичен интерфейс, за да визуализира разговорния поток, да въведе всякакви NLU данни, които Проектът е обучен да разбира и дори да отстранява грешки в крайния продукт в удобен и лесен за разбиране начин.

Разработчиците могат да използват уеб базиран конструктор на блокове или нова IDE за изграждане на съдържание на Асистент. Или могат да използват и двете!

Action SDK прави същото, но в по-традиционна IDE (интегрирана среда за разработка) за разработчици, които предпочитат да работят локално или чрез преглед на проекта на базата на файлове. И ако разработчиците вече имат предпочитан IDE, те могат да го използват в комбинация с инструменти на командния ред за изграждане на крайния продукт със същите предимства.

Тези инструменти са предният край на по-добрата и бърза платформа на Assistant. Времетраенето (мислете за това като за двигател, който задвижва софтуера, който използваме) за Асистент вече е по-бързо от всякога, а изцяло новият модел за взаимодействие означава, че Assistant е едновременно по-умен и по-лесен за изграждане за.

Новият модел на взаимодействие е изграден, така че неща като разговори в реално време да се изграждат по-бързо и по-ефективно, а обучението по NLU е по-стабилно. Разработчиците могат да създават сцени и да ги използват като градивен елемент, където всяка част от Разговорното действие има свои собствени данни и логика. Най-хубавото е, че разработчиците могат да създават сцени и да ги използват повторно в едно и също действие чрез активни намерения.

Джери Хилденбранд

Джери е обитател на Mobile Nation и се гордее с това. Няма нищо, което той да не може да разглоби, но много неща не може да събере отново. Ще го намерите в мрежата на Mobile Nations и можете го удари в Twitter ако искате да кажете хей.

instagram story viewer