Článok

Ako spoločnosť Google vytvorila aplikáciu Rekordér Pixel 4 pomocou strojového učenia

protection click fraud

Strojové učenie je jednou z najúžasnejších nových vecí, ktoré naše smartphony môžu robiť, ale je to pojem, ktorý sa často používa a málokedy pochopí. V príspevok na blogu, Google si našiel čas a podrobne vysvetlil, ako boli algoritmy strojového učenia použité a konkrétne implementované v novej aplikácii Recorder pre telefóny Pixelkonkrétne to, ako je vďaka strojovému učeniu táto najlepšia nahrávacia aplikácia, akú ste kedy vo svojom živote použili.

Jednoduché rozhranie rekordéra klame. Na pozadí je kolekcia kódu, ktorý je určený na počúvanie, porozumenie, prepis a dokonca môžete klasifikovať reč a ďalší zvuk, ktorý váš telefón počuje pri nahrávaní pomocou rekordéra aplikácia Počas nahrávania zvuku si okamžite všimnete niekoľko vecí: okrem prezentovanej vlnovej dĺžky a časovej osi uvidíte aj iné farby a kategórie sa zobrazujú na obrazovke na hlavnej karte, zatiaľ čo vyslovené slová sa nachádzajú na karte prepisov a zobrazujú sa v nich reálny čas.

Verizon ponúka Pixel 4a na nových linkách Unlimited iba za 10 dolárov za mesiac

Rekordér je schopný zabezpečiť tento prepis v reálnom čase, pretože jeho back-endový kód analyzuje prichádzajúci zvuk a porovnáva ho s rôznymi typmi zvuku, ktorý bol použitý. naučený rozumieť. Medzi príklady pochopených kategórií zvuku patrí hudba, reč, pískanie, štekanie psa a množstvo ďalších bežných zvukov. Každá kategória zvuku je vizuálne znázornená pomocou jedinečných farieb, ktoré pomáhajú používateľom rýchlo identifikovať, čo je počuť počas prehrávania, bez toho, aby museli skutočne počúvať zvuk. To je obrovský rozdiel, keď sa pokúsite nájsť niečo po dokončení nahrávania, pretože už nebudete musieť sedieť a drhnúť cez zvuk, aby ste našli to, čo hľadáte.

Rekordér kontroluje každých 50 ms zvukové profily, ale to znamená, že za sekundu uplynie 1 000 milisekúnd klasifikácia by sa neustále menila a divoko menila v závislosti od toho, čo je identifikované ako primárne audio. Aby sa zabránilo tejto šialenej bodovej kategorizácii zvuku, vyvinula spoločnosť Google metódu filtrovania, ktorá vyhadzuje nevyžiadané údaje krížové odkazy na ne s dlhšími vzorkami zaznamenávaného zvuku, čo pomáha lepšej klasifikácii zvukov tým, že sa neustále nemení ich kategória počas počúvania.

Počas nahrávania program Recorder identifikuje slová vyslovené pomocou algoritmu strojového učenia na zariadení. To znamená, že na servery Google (ani z iného iného dôvodu) sa neodosielajú žiadne údaje, pretože procesor na doske dokáže skontrolovať správnosť slov v porovnaní so slovníkom v zariadení. Slová sa porovnávajú s rozhodovacím stromom, ktorý obsahuje filtrovanie vecí, ako sú nadávky. Tento model je taký pokročilý, že je schopný identifikovať gramatické roly slov, čo mu pomáha vytvárať celé vety pre ďalšie použitie.

Tieto slová sa potom zostavia do časovej osi vo vetnej štruktúre a priradí sa im pozícia na časovej osi. Po dokončení záznamu je možné slová vizuálne prechádzať a vyhľadávať. Používatelia môžu dokonca kliknúť na každé slovo, ktoré sa má v nahrávke presmerovať na konkrétny čas, čo pomáha lepšie pochopiť kontext a význam. Použitím týchto kategórií a rozpoznávania slov môže Google dokonca poskytnúť tri značky, ktoré sa použijú na konci záznamu, aby tak rýchlejšie a presnejšie pomenovali záznam.

Ako používať aplikáciu Rekordér Pixel 4

instagram story viewer