Android Central

Gmail вече е много по-добър в откриването на спам след основно надграждане

protection click fraud

Какво трябва да знаете

  • Gmail вече включва нов векторизатор на текст, наречен RETVec, който води до 38% по-добро откриване на спам.
  • Текстовите векторизатори помагат за идентифицирането на букви и символи в имейлите и съответно се сортират като спам.
  • Някои податели на нежелана поща манипулират букви и символи, използват хомоглифи, добавят невидими знаци и използват препълване с ключови думи, за да се опитат да заобиколят филтрите за спам.

Откриване на спам в Gmail трябва да се подобри благодарение на бек-енд надстройка за идентификация на текст в някои услуги на Google. Благодарение на надграждането на сигурността Google казва, че Gmail вече е с 38% по-добър в откриването на спам.

Компанията обяви актуализацията наскоро в Google Security блог пост (чрез 9to5Google). Преди това беше тествано вътрешно в Google през последната година. Това представлява „най-големите подобрения в отбраната през последните години“, казва компанията.

Новото допълнение към откриването на спам в Gmail е RETVec, което означава Resilient & Efficient Text Vectorizer. Текстовите векторизатори се използват за идентифициране на съдържанието на имейл, което понякога е скрито от подателя. Манипулиране на букви и символи, използване на хомоглифи (различни знаци, които изглеждат подобни), добавяне на невидими знаци и използване на препълване с ключови думи, за да се опитате да заобиколите филтрите за спам.

„RETVec постига тези подобрения, като предлага много лек модел за вграждане на думи (~200k параметри)“, каза Google в публикацията. „Позволява ни да намалим размера на модела Transformer при еднаква или по-добра производителност и има способността да разделяме изчислението между хоста и TPU по ефективен начин за мрежа и памет.“

Числата зад новия инструмент за откриване на спам на Gmail.
(Кредит за изображение: Google)

Най-голямото предимство на RETVec е, че той е с 38% по-добър в откриването на спам, но има и много други подобрения. Това подобрение на точността включва намаляване на фалшивите положителни резултати с близо 20% и на фалшивите отрицателни резултати с близо 18%. Фалшивите отрицания са, когато детекторът на спам на Gmail не успее да филтрира спам имейл като спам, а фалшивите положителни резултати са, когато валидните имейли са неправилно сортирани като спам.

Тъй като Google успя да намали размера на модела Transformer, използването на RETVec намали използването на Tensor Processing Unit с 83%. Това е значително предимство при използването на този нов векторизатор на текст в Gmail.

RETVec е разработен от Google Research и е с изцяло отворен код. След продължителния период на вътрешно тестване на Google, компанията откри, че е „много ефективен за приложения за сигурност и против злоупотреби“.

Хората, които искат да използват RETVec за свои собствени приложения, могат да следват a урок от Google, който обяснява как да започнете.

instagram story viewer