Статья

Вот как Google удается заставить Ассистента думать как человек

protection click fraud

Google Ассистент превратилась в собственную платформу с момента ее запуска. Он не только умнее, чем когда-либо, но и с такими устройствами, как Nest Hub или Nest Mini, это уже не просто часть Android.

Конечно, когда возможности программного обеспечения расширяются, оно также становится более сложным. Это означает, что разработчикам нужны специальные инструменты для создания контента, который мы хотим использовать на наших интеллектуальных дисплеях и других устройствах с поддержкой Assistant. Как и любые инструменты разработчика, им необходимо сделать две важные вещи: быть простыми в использовании и хорошо работать. Трудно осуществить обе эти важные вещи, но выпуск Веб-интерфейс Actions Builder и Actions SDK похоже, они будут победителями.

Пусть разговор течет

Чтобы Google Assistant Action был отличным, он должен уметь говорить и слушать, как человек. Если вы спросите своего Google Home Чтобы рассказать своим детям сказку на ночь или спеть песню «Чисти зубы», ребенку нужно понимать, чего вы хотите, и уметь делать то, о чем вас просят, не будучи роботом, который следует только логике и порядку.

Verizon предлагает Pixel 4a всего за 10 долларов в месяц на новых безлимитных линиях

Две важные вещи, которые делают это реальностью, называются разговорным потоком и пониманием естественного языка. Без них Ассистент не смог бы взаимодействовать так, как мы привыкли.

«Да», «да» и «да» означают одно и то же. Вы должны научить компьютер такой ошибочной человеческой логике.

Поток разговора - это довольно простая для понимания концепция, и она буквально означает именно то, на что она похожа: Ассистент должен быть готов ответить вам, когда вы ему что-то сказали. Это легко, когда вы спрашиваете погоду или даже просите его спеть песню о чистке зубов, но когда все становится сложным - например, выберите свой собственная приключенческая игра, например - есть несколько очень специфических способов ведения разговора, чтобы у Ассистента был ответ.

Вот тут-то и появляется понимание естественного языка (NLU). Ассистенту необходимо знать, что такие вещи, как «да», «ага» и «да» означают одно и то же, и он должен распознавать плавность речи; мы все говорим совсем не так, как пишем. А поскольку Assistant - это компьютер, который действует только как человек, все это необходимо вводить в любой проект Conversational Action. Компьютеры не могут учиться, их нужно программировать.

Вот где в игру вступают новый Google Actions Builder и Actions SDK. Это два новых инструмента, которые позволяют разработчикам создавать проект от начала до конца так, как им удобнее всего. Конструктор действий - это веб-инструмент, который позволяет разработчикам создавать диалоговые действия так же, как вы строите блок-схему. Но в нем есть те же инструменты, что и в традиционном SDK для разработки. Любой разработчик может использовать этот графический интерфейс для визуализации диалогового потока, ввода любых данных NLU, которые проект был обучен понимать и даже отлаживать конечный продукт в удобном и понятном путь.

Разработчики могут использовать веб-конструктор блоков или новую среду IDE для создания содержимого Assistant. Или они могут использовать оба!

Actions SDK делает то же самое, но в более традиционной IDE (интегрированной среде разработки) для разработчиков, которые предпочитают работать локально или с помощью файлового обзора своего проекта. И если у разработчиков уже есть предпочтительная IDE, они могут использовать ее в сочетании с инструментами командной строки для создания конечного продукта со всеми теми же преимуществами.

Эти инструменты представляют собой интерфейс к более совершенной и быстрой платформе Assistant. Среда выполнения (думайте об этом как о движке, на котором работает программное обеспечение, которое мы используем) для Assistant теперь быстрее чем когда-либо прежде, а совершенно новая модель взаимодействия означает, что помощник умнее и проще в сборке. за.

Новая модель взаимодействия построена таким образом, что такие вещи, как разговоры в реальном времени, строятся быстрее и эффективнее, а обучение NLU более надежно. Разработчики могут создавать сцены и использовать их как строительный блок, в котором каждая часть диалогового действия имеет свои собственные данные и логику. Лучше всего то, что разработчики могут создавать сцены и повторно использовать их в одном действии с помощью активных намерений.

Джерри Хильденбранд

Джерри является постоянным ботаником Mobile Nation и гордится этим. Нет ничего, что он не мог бы разобрать, но многие вещи он не мог бы собрать заново. Вы найдете его в сети Mobile Nations и сможете напиши ему в Твиттере если хочешь поздороваться.

instagram story viewer