El servicio de correo electrónico de Google, Gmail, acaba de implementar un nuevo método que ha resultado en un impresionante aumento del 38% en la detección de spam.
Este avance es el resultado de una mejor identificación de texto, lo que permite a Gmail combatir los mensajes no deseados, el phishing y el contenido malicioso de manera aún más efectiva.
Los spammers suelen utilizar técnicas como el uso de caracteres similares a letras reales, caracteres invisibles y el relleno excesivo de palabras clave para eludir los modelos de clasificación de texto de Gmail.
Sin embargo, el nuevo método, llamado RETVec (Resilient & Efficient Text Vectorizer), desarrollado por el equipo de investigación de Google, ha logrado superar con éxito estas tácticas.
RETVec es un enfoque innovador que ofrece un rendimiento de clasificación de última generación y reduce significativamente los costos computacionales.
Además, es capaz de admitir todos los idiomas y caracteres UTF-8 sin necesidad de preprocesamiento de texto. Esta flexibilidad hace que RETVec sea ideal para su uso en dispositivos móviles, web y otros casos de gran escala.
La implementación de RETVec en Gmail ha demostrado resultados impresionantes. Además del aumento del 38% en la detección de spam, también hubo una reducción del 19,4% en la tasa de falsos positivos y una disminución del 83% en el uso de las Unidades de Procesamiento Tensorial (TPUs).
Estas mejoras fueron posibles gracias a un modelo de incorporación de palabras extremadamente liviano y a una división eficiente del procesamiento entre el servidor y la TPU.
Google probó exhaustivamente RETVec durante el último año y, demostrando su eficacia en aplicaciones de seguridad y combate al abuso, decidió ponerlo a disposición para uso externo.
Si desea aprovechar este nuevo método para mejorar la detección de spam en sus propios sistemas o investigaciones, Google ha creado un tutorial para ayudarlo a comenzar.