Bagaimana Google membuat aplikasi Perekam Pixel 4 menggunakan pembelajaran mesin

Pembelajaran mesin adalah salah satu hal baru yang paling menakjubkan yang dapat dilakukan ponsel cerdas kita, tetapi itu adalah istilah yang sering digunakan dan jarang dipahami. Di sebuah posting blog, Google meluangkan waktu untuk menjelaskan secara mendetail bagaimana algoritme pembelajaran mesin digunakan dan diterapkan secara khusus di aplikasi Perekam baru untuk ponsel Pixel, khususnya bagaimana pembelajaran mesin menjadikan ini aplikasi perekaman terbaik yang pernah Anda gunakan dalam hidup Anda.

Antarmuka sederhana perekam menipu. Di bagian belakang adalah kumpulan kode yang dirancang untuk mendengarkan, memahami, mentranskripsikan, dan bahkan mengklasifikasikan ucapan dan audio lain yang didengar oleh ponsel Anda saat merekam dengan Perekam aplikasi. Saat merekam audio, Anda akan segera melihat beberapa hal: selain panjang gelombang dan garis waktu yang disajikan, Anda juga akan melihat perbedaannya warna dan kategori muncul di layar pada tab utama, sedangkan kata-kata yang diucapkan terletak di tab transkripsi dan muncul di waktu sebenarnya.

instagram viewer

Verizon menawarkan Pixel 4a hanya dengan $ 10 / bln pada jalur Unlimited baru

Perekam mampu menyediakan transkripsi waktu nyata ini karena kode ujung belakangnya menganalisis audio yang masuk dan mereferensikan silang dengan berbagai jenis audio yang telah digunakan. diajarkan untuk memahami. Contoh kategori audio yang dipahami termasuk musik, ucapan, siulan, gonggongan anjing, dan banyak suara umum lainnya. Setiap kategori suara diwakili secara visual dengan menggunakan warna unik yang membantu pengguna dengan cepat mengidentifikasi apa yang sedang didengar selama pemutaran tanpa harus benar-benar mendengarkan audionya. Hal itu membuat perbedaan besar ketika mencoba menemukan sesuatu setelah perekaman selesai, karena Anda tidak perlu lagi duduk dan menggosok audio hanya untuk menemukan apa yang Anda cari.

Perekam memeriksa setiap 50 ms untuk profil suara tetapi, karena ada 1000 milidetik dalam satu detik, itu berarti klasifikasi akan terus berubah dan sangat bervariasi tergantung pada apa yang diidentifikasi sebagai yang utama audio. Untuk menghindari kategorisasi audio gila-gilaan semacam ini, Google telah mengembangkan metode pemfilteran yang membuang data sampah dengan mereferensikannya dengan sampel audio yang lebih panjang yang sedang direkam, dengan demikian, membantu mengklasifikasikan suara dengan lebih baik dengan tidak terus-menerus mengganti kategorinya selama mendengarkan.

Selama perekaman, Perekam mengidentifikasi kata-kata yang diucapkan melalui algoritma pembelajaran mesin di perangkat. Itu berarti tidak ada data yang dikirim ke server Google (atau di mana pun, dalam hal ini), karena prosesor onboard dapat memeriksa semacam kamus di perangkat untuk memastikan kata-kata yang benar. Kata-kata diperiksa berdasarkan pohon keputusan yang mencakup pemfilteran hal-hal seperti kata-kata makian. Model ini sangat maju bahkan mampu mengidentifikasi peran gramatikal kata, lebih baik membantunya membentuk kalimat lengkap untuk digunakan nanti.

Kata-kata ini kemudian dikumpulkan menjadi garis waktu dalam struktur kalimat dan diberi posisi di garis waktu. Kata-kata dapat digulir secara visual dan dicari setelah perekaman selesai. Pengguna bahkan dapat mengklik setiap kata untuk dibawa ke waktu tertentu dalam rekaman, membantu lebih memahami konteks dan makna. Dengan memanfaatkan kategori ini, serta pengenalan kata, Google bahkan dapat memberikan tiga tag untuk digunakan di akhir rekaman untuk membantu memberi nama rekaman dengan lebih cepat dan akurat.

Cara menggunakan aplikasi Perekam Pixel 4

Artikel

Bagaimana Google membuat aplikasi Perekam Pixel 4 menggunakan pembelajaran mesin

kategori

Blog Terbaru

Baca Sekarang