Makale

Google, makine öğrenimini kullanarak Pixel 4'ün Kaydedici uygulamasını nasıl oluşturdu?

protection click fraud

Makine öğrenimi, akıllı telefonlarımızın yapabileceği en şaşırtıcı yeni şeylerden biridir, ancak sıklıkla kullanılan ve nadiren anlaşılan bir terimdir. İçinde bir blog yazısıGoogle, makine öğrenimi algoritmalarının özellikle yeni Kaydedici uygulamasında nasıl kullanıldığını ve uygulandığını ayrıntılı olarak açıklamak için zaman ayırdı Pixel telefonlar için, özellikle makine öğreniminin bunu nasıl hayatınızda kullandığınız en iyi kayıt uygulaması haline getirdiği.

Kaydedicinin basit arayüzü aldatıcıdır. Arka uçta, dinlemek, anlamak, yazıya dönüştürmek ve Kaydedici ile kayıt yaparken telefonunuz tarafından duyulan konuşmayı ve diğer sesleri bile sınıflandırın app. Ses kaydederken birkaç şeyi hemen fark edeceksiniz: sunulan dalga boyu ve zaman çizelgesinin yanı sıra, farklı renkler ve kategoriler ana sekmede ekranda görünür, söylenen kelimeler deşifre sekmesinde bulunur ve gerçek zaman.

Verizon, Pixel 4a'yı yeni Sınırsız hatlarda ayda sadece 10 ABD doları karşılığında sunuyor

Kaydedici, bu gerçek zamanlı transkripsiyonu sağlayabilir çünkü arka uç kodu, gelen sesi analiz eder ve ona farklı ses türleriyle çapraz referans verir.

anlamayı öğretti. Anlaşılan ses kategorilerinin örnekleri arasında müzik, konuşma, ıslık, köpek havlaması ve diğer birçok yaygın ses bulunur. Her ses kategorisi, kullanıcıların sesi gerçekten dinlemek zorunda kalmadan oynatma sırasında duyulanları hızlı bir şekilde tanımlamasına yardımcı olan benzersiz renkler kullanılarak görsel olarak temsil edilir. Bu, kayıt bittikten sonra bir şey bulmaya çalışırken büyük bir fark yaratır, çünkü artık sadece aradığınızı bulmak için oturup ses arasında gezinmek zorunda kalmayacaksınız.

Kaydedici, ses profilleri için her 50 ms'de bir kontrol eder, ancak saniyede 1000 milisaniye olduğu için sınıflandırma, birincil olarak tanımlanan şeye bağlı olarak sürekli değişir ve çılgınca değişir ses. Google, bu tür çılgın dağınık beyinli ses sınıflandırmasından kaçınmak için önemsiz verileri şu şekilde dışarı atan bir filtreleme yöntemi geliştirdi: Kaydedilen sesin daha uzun örnekleriyle çapraz referans oluşturarak, kategorilerini sürekli değiştirmeyerek sesleri daha iyi sınıflandırmaya yardımcı olur dinleme sırasında.

Kaydedici, kayıt sırasında cihazdaki bir makine öğrenimi algoritması aracılığıyla söylenen kelimeleri tanımlar. Bu, Google sunucularına (veya bu konuda başka herhangi bir yere) hiçbir veri gönderilmediği anlamına gelir, çünkü yerleşik işlemci doğru kelimeleri sağlamak için cihaz üzerindeki bir tür sözlüğe karşı kontrol yapabilir. Kelimeler, küfür kelimeleri gibi şeylerin filtrelenmesini içeren bir karar ağacına göre kontrol edilir. Bu model o kadar gelişmiştir ki, kelimelerin gramer rollerini bile belirleyerek daha sonra kullanmak üzere tam cümleler oluşturmasına yardımcı olur.

Bu kelimeler daha sonra cümle yapısında bir zaman çizelgesine birleştirilir ve zaman çizelgesinde bir konum atanır. Kayıt bittikten sonra sözcükler görsel olarak kaydırılabilir ve aranabilir. Kullanıcılar, kayıttaki belirli bir zamana götürülecek her kelimeyi tıklayarak bağlamı ve anlamı daha iyi anlamaya yardımcı olabilir. Bu kategorileri ve kelime tanımayı kullanarak Google, kaydın daha hızlı ve doğru bir şekilde adlandırılmasına yardımcı olmak için bir kaydın sonunda kullanılmak üzere üç etiket bile sağlayabilir.

Pixel 4'ün Kaydedici uygulaması nasıl kullanılır

instagram story viewer