Gmail er nå mye bedre til å oppdage søppelpost etter en større oppgradering

Hva du trenger å vite

Gmail har nå en ny tekstvektor kalt RETVec, som resulterer i 38 % bedre gjenkjenning av søppelpost.
Tekstvektorer hjelper til med å identifisere bokstaver og symboler i e-poster og sorteres som spam deretter.
Noen spam-avsendere manipulerer bokstaver og symboler, bruker homoglyfer, legger til usynlige tegn og bruker nøkkelordstopping for å prøve å omgå spamfiltre.

Deteksjon av søppelpost i Gmail bør forbedres takket være en backend-oppgradering til tekstidentifikasjon på tvers av noen Google-tjenester. Takket være sikkerhetsoppgraderingen sier Google at Gmail nå er 38 % bedre til å oppdage spam.

Selskapet kunngjorde oppdateringen nylig i en Google Security blogg innlegg (via 9to5Google). Før det ble den testet internt hos Google det siste året. Det representerer de "største forsvarsoppgraderingene de siste årene," sier selskapet.

Det nye tillegget til Gmail-søppeloppdaging er RETVec, som står for Resilient & Efficient Text Vectorizer. Tekstvektorer brukes til å identifisere innholdet i en e-post, som noen ganger er skjult av avsenderen. Manipulere bokstaver og symboler, bruke homoglyfer (ulike tegn som ser like ut), legge til usynlige tegn og bruke nøkkelordstopping for å prøve å omgå spamfiltre.

instagram viewer

"RETVec oppnår disse forbedringene ved å bruke en veldig lett modell for innebygging av ord (~200k parametere)," sa Google i innlegget. "Tillater oss å redusere Transformer-modellens størrelse med lik eller bedre ytelse, og har muligheten til å dele beregningen mellom verten og TPU på en nettverks- og minneeffektiv måte."

Tallene bak Gmails nye søppeloppdagingsverktøy. — (Bildekreditt: Google)

Den største fordelen med RETVec er at den er 38 % bedre til å oppdage spam, men det er mange andre forbedringer også. Denne nøyaktighetsforbedringen inkluderer en reduksjon i falske positive med nesten 20 % og i falske negative med nesten 18 %. Falske negativer er når Gmails spam-detektor ikke klarer å filtrere en spam-e-post som spam, og falske positive er når gyldige e-poster er feil sortert som spam.

Siden Google har klart å redusere størrelsen på transformatormodellen, reduserte bruken av RETVec bruken av Tensor Processing Unit med 83 %. Det er en betydelig effektivitetsfordel ved å bruke denne nye tekstvektoren i Gmail.

RETVec ble utviklet av Google Research, og det er helt åpen kildekode. Etter Googles lange interne testperiode fant selskapet at det var "svært effektivt for sikkerhet og anti-misbruksapplikasjoner."

Folk som ønsker å bruke RETVec til sine egne applikasjoner kan følge en opplæringen fra Google som forklarer hvordan du kommer i gang.

Android Sentral

Gmail er nå mye bedre til å oppdage søppelpost etter en større oppgradering

Hva du trenger å vite

kategorier

Siste blogginnlegg

Les Nå