Αρθρο

Πώς η Google δημιούργησε την εφαρμογή εγγραφής Pixel 4 χρησιμοποιώντας μηχανική εκμάθηση

protection click fraud

Η μηχανική εκμάθηση είναι ένα από τα πιο εκπληκτικά νέα πράγματα που μπορούν να κάνουν τα smartphone μας, αλλά είναι ένας όρος που χρησιμοποιείται συχνά και σπάνια κατανοείται. Σε μια ανάρτηση ιστολογίου, Η Google αφιέρωσε χρόνο για να εξηγήσει λεπτομερώς τον τρόπο με τον οποίο οι αλγόριθμοι μηχανικής μάθησης χρησιμοποιήθηκαν και εφαρμόστηκαν ειδικά στη νέα εφαρμογή Recorder για τηλέφωνα Pixel, ειδικά πώς η μηχανική εκμάθηση το καθιστά την καλύτερη εφαρμογή εγγραφής που έχετε χρησιμοποιήσει ποτέ στη ζωή σας.

Η απλή διεπαφή του Recorder είναι εξαπατημένη. Στο πίσω μέρος υπάρχει μια συλλογή κώδικα που έχει σχεδιαστεί για να ακούει, να κατανοεί, να μεταγράφει και ακόμη και ταξινομήστε την ομιλία και τον άλλο ήχο που ακούγεται από το τηλέφωνό σας κατά την εγγραφή με τη συσκευή εγγραφής εφαρμογή. Κατά την εγγραφή ήχου, θα παρατηρήσετε αμέσως μερικά πράγματα: εκτός από το μήκος κύματος και το χρονοδιάγραμμα που παρουσιάζονται, θα δείτε επίσης διαφορετικά Τα χρώματα και οι κατηγορίες εμφανίζονται στην οθόνη στην κύρια καρτέλα, ενώ οι λέξεις που αναφέρονται βρίσκονται στην καρτέλα μεταγραφής και εμφανίζονται στην πραγματικός χρόνος.

Η Verizon προσφέρει το Pixel 4a με μόλις $ 10 / μήνα σε νέες Απεριόριστες γραμμές

Το Recorder είναι σε θέση να παρέχει αυτήν τη μεταγραφή σε πραγματικό χρόνο, επειδή ο κώδικας back-end αναλύει τον ήχο που εισέρχεται και παραπέμπει σε διαφορετικούς τύπους ήχου που έχει δίδαξε να καταλαβαίνει. Παραδείγματα κατανοητών κατηγοριών ήχου περιλαμβάνουν μουσική, ομιλία, σφυρίχτρα, γαύγισμα σκύλου και πολλούς άλλους κοινούς ήχους. Κάθε κατηγορία ήχου απεικονίζεται οπτικά χρησιμοποιώντας μοναδικά χρώματα που βοηθούν τους χρήστες να αναγνωρίσουν γρήγορα αυτό που ακούγεται κατά την αναπαραγωγή χωρίς να χρειάζεται να ακούσουν πραγματικά τον ήχο. Αυτό κάνει τεράστια διαφορά όταν προσπαθείτε να βρείτε κάτι μετά την ολοκλήρωση της ηχογράφησης, καθώς δεν θα χρειάζεται πλέον να καθίσετε και να καθαρίσετε ήχο για να βρείτε αυτό που ψάχνετε.

Το Recorder ελέγχει κάθε 50ms για προφίλ ήχου, αλλά, αφού υπάρχουν 1000 χιλιοστά του δευτερολέπτου σε ένα δευτερόλεπτο, αυτό σημαίνει η ταξινόμηση θα άλλαζε συνεχώς και θα ποικίλλει άγρια ​​ανάλογα με το τι προσδιορίζεται ως το κύριο ήχος. Για να αποφευχθεί αυτή η τρελή κατηγοριοποίηση ήχου με σκέδαση, η Google έχει αναπτύξει μια μέθοδο φιλτραρίσματος που πετά τα ανεπιθύμητα δεδομένα από παραπέμποντάς το με μεγαλύτερα δείγματα του ήχου που εγγράφεται, βοηθώντας έτσι στην καλύτερη ταξινόμηση των ήχων χωρίς να αλλάζετε συνεχώς την κατηγορία τους κατά την ακρόαση.

Κατά τη διάρκεια της εγγραφής, το Recorder αναγνωρίζει λέξεις που εκφωνούνται μέσω ενός αλγορίθμου μηχανικής εκμάθησης στη συσκευή. Αυτό σημαίνει ότι δεν αποστέλλονται δεδομένα στους διακομιστές της Google (ή οπουδήποτε αλλού, για αυτό το θέμα), καθώς ο ενσωματωμένος επεξεργαστής μπορεί να ελέγξει ένα είδος λεξικού στη συσκευή για να εξασφαλίσει τις σωστές λέξεις. Οι λέξεις ελέγχονται έναντι ενός δέντρου αποφάσεων που περιλαμβάνει το φιλτράρισμα πραγμάτων όπως λέξεις ορκωμοσίας. Αυτό το μοντέλο είναι τόσο προηγμένο που μπορεί ακόμη και να εντοπίσει γραμματικούς ρόλους λέξεων, βοηθώντας καλύτερα να σχηματίσει πλήρεις προτάσεις για μελλοντική χρήση.

Αυτές οι λέξεις στη συνέχεια συναρμολογούνται σε ένα χρονοδιάγραμμα στη δομή των προτάσεων και εκχωρείται μια θέση στο χρονοδιάγραμμα. Οι λέξεις μπορούν να μετακινηθούν οπτικά και να αναζητηθούν μετά την ολοκλήρωση της εγγραφής. Οι χρήστες μπορούν ακόμη και να κάνουν κλικ σε κάθε λέξη που θα μεταφερθεί στον συγκεκριμένο χρόνο στην ηχογράφηση, βοηθώντας να κατανοήσουμε καλύτερα το περιεχόμενο και το νόημα. Χρησιμοποιώντας αυτές τις κατηγορίες, καθώς και αναγνώριση λέξεων, η Google μπορεί ακόμη και να παρέχει τρεις ετικέτες για χρήση στο τέλος μιας ηχογράφησης για να βοηθήσει πιο γρήγορα και με ακρίβεια να ονομάσει την εγγραφή.

Πώς να χρησιμοποιήσετε την εφαρμογή εγγραφής Pixel 4

instagram story viewer