Nadszedł czas, aby inteligentni asystenci ewoluowali poza stałe słowa budzenia, takie jak „Hej Google

Podczas przeglądania Samsunga Galaxy S22+, włączyłem Bixby Voice, aby przetestować jego czas reakcji, a potem z czystego lenistwa zostawiłem ustawienie ciągłego słuchania. Co kilka dni dzwonek aktywacyjny Bixby pojawi się znikąd, prosząc mnie o powtórzenie lub odpowiadając na pytania, których nie zadałem.

Dlaczego? Bo ja niedawno adoptował kota o imieniu Blue, którą mój partner i ja lubimy nazywać „Silly Baby” śpiewnym głosem (nie oceniaj, wszyscy dzieci rozmawiają ze swoimi zwierzakami). I najwyraźniej brzmi to jak „Hi Bixby” dla algorytmów Samsunga.

Bixby nie jest jedynym nadmiernie rozmownym asystentem w naszym miejscu. Nasz Echo Show 8 w większości działa zgodnie z przeznaczeniem, ale Alexa losowo wtrąca się z „Przepraszam, nie rozumiem” lub „Oto coś, co znalazłem w sieci” w trakcie zwykłych rozmów. Nie jesteśmy pewni, jakie słowo lub fraza to powoduje, więc przyzwyczailiśmy się krzyczeć „Alexa, to nie było dla ciebie” do nieszczęsnej sztucznej inteligencji.

A Asystent Google Ci na to pozwala

instagram viewer

zmniejszyć czułość mikrofonu, w odpowiedzi na własne skargi konsumentów dotyczące fałszywych trafień.

Rozwiązaniem Amazona było zmień słowo budzenia Alexa do trzech innych opcji: komputer, Amazon lub Echo. Ale wybranie pierwszych dwóch oznaczałoby ocenzurowanie tych słów z regularnych dyskusji i Echo brzmi wystarczająco podobnie, aby „iść”, co wydaje się jeszcze bardziej podatne na codzienne wywoływanie fałszywych alarmów zwroty. Pozostajemy więc przy opcji domyślnej.

Echo Show 8 2. generacji 3 — Mnóstwo mówców słuchających tych samych fraz (Źródło zdjęcia: Jeramy Johnson / Android Central)

Niezależnie od posiadanego smartfona, inteligentnego głośnika lub inteligentnego wyświetlacza, będziesz mieć do czynienia z niektórymi fałszywymi alarmami. Zezwalanie firmom na przechowywanie Twojego profilu głosowego pomaga nieco z dokładnością słów. Ale mów wystarczająco długo, a jeden przypadkowy ciąg sylab nieuchronnie zabrzmi jak hasło-klucz.

Dlaczego ten problem nie zniknął? Na początek, ponieważ firmy chcą, abyś w kółko powtarzał branding firmy. Powiedz „Hej, Siri” lub „Hej, Google” wystarczająco dużo razy, a zaczniesz kojarzyć odpowiedzi na pytania lub sterowanie inteligentnym domem z tą marką. Więc nawet jeśli inne słowo lub wyrażenie, takie jak „ksylofon”, rzadziej pojawiałoby się w języku potocznym, nie miałoby takiego efektu marketingowego, jakiego oczekują.

Marki chcą również, abyś myślał o swoim asystencie jako o osobie, dlatego wkładają tyle wysiłku w przygotowanie uroczych odpowiedzi, które symulują osobowość. Jest powód 3 na 4 czytniki Android Central dziękować swoim asystentom, gdy wykonują zadania. Jeśli widzisz Alexę jako pomocną sztuczną osoba z nazwa, masz mniejsze szanse na zmianę ekosystemów inteligentnego domu.

Prawdopodobnie występują również pewne trudności techniczne związane z prawidłowym reagowaniem asystenta na różne frazy, co prowadzi do większej liczby nieodebranych zapytań lub wolniejszego czasu odpowiedzi. Google nawet żartował z tego podczas swojego Transmisja na żywo z I/O 2018, kiedy Kevin Durant powtarzał „Hej, Google”, a ktoś żartował, że „Jestem pewien, że inżynierowie Miłość zaktualizować wszystko” i przejść do tego.

Google IO 2021 Keynote Pluton — Model językowy Google dla aplikacji dialogowych (LaMDA) (Źródło zdjęcia: Google)

Ale nawet uznając to wszystko, twierdzę, że przynajmniej Google może z łatwością uzyskać lepszy wybór słów budzących. Asystent pozwala teraz aktywować polecenia za pomocą Szybkie zwroty Lub „zatrzymaj” Asystenta Google bez słowa przebudzenia. Dodatkowo, w najnowszym I/O, Google przedstawiło swoją nowość LaMDA tech, w której Asystent może prowadzić pełne dialogi z wieloma zapytaniami, aby odpowiedzieć na wszystkie pytania — choć wciąż jest to daleko.

Google jest królem opcji dostosowywania. Może z łatwością pozwolić ci zastąpić inne słowa po „Hej”, które nie są tak łatwe do przypadkowego wypowiedzenia lub wzięte z reklamy.

Zapewniłoby to również, że osoby z wieloma inteligentnymi głośnikami i telefonami w pobliżu mogą mieć określone słowa budzenia dla różnych urządzeń, więc nie wszystkie aktywują się jednocześnie z jednej frazy.

Asystent jest wystarczająco inteligentny, by obsłużyć inną frazę, która nie uruchomi Twojego Nest za każdym razem, gdy usłyszysz „Hej, Google” w reklamie telewizyjnej. I sprawiłoby, że Siri i Bixby wyglądaliby sztywno i wstecz w porównaniu, ponieważ uważam, że jest mniej prawdopodobne, że Apple lub Samsung rozgałęzią się w ten sam sposób. To Asystent Google i Alexa poprowadź grupę inteligentnych asystentów i mieć mózgi AI, aby to zrobić.

Jeśli chodzi o Amazon, już udowodniono, że może on stanowić alternatywę dla Alexy. Wolałbym po prostu, aby rozszerzyły się jego opcje słowa budzenia — przynajmniej do kilku bardziej stałych opcji lub (w najlepszym przypadku) naszych własnych niestandardowych fraz.

Migawka Asystenta Google na Galaxy S22 (Źródło zdjęcia: Derrek Lee / Android Central)

Inteligentne domy w 2022 roku nie oferują wiele ekscytacji. Uniwersalny standard Materiał powinien pojawić się przed końcem 2022 r., ale był wielokrotnie opóźniany, przez co inteligentne urządzenia domowe są podzielone na różne ekosystemy. Większość ludzi używa tylko najprostszych Umiejętności Alexy lub Działania Google. Google zabija Snapshot (powyżej) dla Asystenta.

Jedyne ekscytujące wiadomości, które zauważyliśmy, to nadchodzące Nest Hub z Androidem 13, ale to bardziej kwestia ekranu dotykowego niż asystenta głosowego za nim. Myślę, że potrzebujemy czegoś więcej, na co czekamy.

Mogę mieć tylko nadzieję na przyszłość inteligentne głośniki i telefony z Androidem umożliwiają nowe i ulepszone słowa budzenia. W przeciwnym razie, bez względu na to, jak inteligentna stanie się sztuczna inteligencja, Alexa, Bixby i Asystent Google będą wpadać w rozmowy bez zaproszenia, jak Kool-Aid Man.

Centrala Androida

Nadszedł czas, aby inteligentni asystenci ewoluowali poza stałe słowa budzenia, takie jak „Hej Google

Kategorie

Najnowszy post na blogu

Czytaj Teraz