Článek

Jak společnost Google vytvořila aplikaci Rekordér Pixel 4 pomocí strojového učení

protection click fraud

Strojové učení je jednou z nejúžasnějších nových věcí, které naše smartphony dokážou, ale je to pojem, který se často používá a málokdy mu rozumíme. v příspěvek na blogu, Google si našel čas podrobně vysvětlit, jak byly algoritmy strojového učení použity a implementovány konkrétně v nové aplikaci Recorder pro telefony Pixelkonkrétně to, jak díky strojovému učení je tato nejlepší nahrávací aplikace, jakou jste kdy ve svém životě použili.

Jednoduché rozhraní rekordéru klame. V back-endu je kolekce kódu, který je určen k naslouchání, porozumění, přepisu a dokonce klasifikujte řeč a další zvuk, který váš telefon slyší při nahrávání pomocí rekordéru aplikace. Při nahrávání zvuku si hned všimnete několika věcí: kromě prezentované vlnové délky a časové osy uvidíte také jiné barvy a kategorie se zobrazují na obrazovce na hlavní kartě, zatímco vyslovovaná slova se nacházejí na kartě přepisu a zobrazují se v reálný čas.

Verizon nabízí Pixel 4a za pouhých 10 $ / měsíc na nových linkách Unlimited

Rekordér je schopen poskytnout tento přepis v reálném čase, protože jeho back-endový kód analyzuje přicházející zvuk a porovnává jej s různými typy zvuku, který byl

naučil rozumět. Příklady porozuměných zvukových kategorií zahrnují hudbu, řeč, pískání, štěkání psů a spoustu dalších běžných zvuků. Každá kategorie zvuku je vizuálně znázorněna pomocí jedinečných barev, které uživatelům pomáhají rychle identifikovat, co je slyšet během přehrávání, aniž by museli skutečně poslouchat zvuk. To dělá obrovský rozdíl, když se pokoušíte něco najít po dokončení nahrávání, protože už nebudete muset sedět a drhnout zvukem, jen abyste našli to, co hledáte.

Rekordér kontroluje každých 50 ms zvukové profily, ale to znamená, že za sekundu je 1000 milisekund, to znamená klasifikace by se neustále měnila a divoce se lišila v závislosti na tom, co je označeno jako primární Zvuk. Abychom se vyhnuli této šílené roztříštěné kategorizaci zvuku, Google vyvinul metodu filtrování, která vyhodí nevyžádaná data křížové odkazy s delšími vzorky zaznamenávaného zvuku, což pomáhá lépe klasifikovat zvuky tím, že neustále nepřepíná jejich kategorii během poslechu.

Během nahrávání Recorder identifikuje slova mluvená pomocí algoritmu strojového učení na zařízení. To znamená, že na servery Google (ani nikde jinde) se neposílají žádná data, protože integrovaný procesor je schopen zkontrolovat správnost slov podle jakéhokoli slovníku v zařízení. Slova jsou porovnávána s rozhodovacím stromem, který zahrnuje filtrování věcí, jako jsou nadávky. Tento model je tak pokročilý, že dokonce dokáže identifikovat gramatické role slov, což mu pomáhá vytvářet celé věty pro pozdější použití.

Tato slova jsou poté sestavena do časové osy ve struktuře vět a přiřazena pozice na časové ose. Po dokončení záznamu lze slova vizuálně posouvat a hledat. Uživatelé mohou dokonce kliknout na každé slovo, které má být přeneseno do konkrétního času záznamu, což pomáhá lépe porozumět kontextu a významu. Využitím těchto kategorií a rozpoznávání slov může Google dokonce poskytnout tři značky pro použití na konci záznamu, aby rychleji a přesněji pomohl pojmenovat záznam.

Jak používat aplikaci Rekordér Pixel 4

instagram story viewer