Un nouveau modèle pour détecter et filtrer automatiquement les spams

Un nouveau modèle pour détecter et filtrer automatiquement les spams

Crédit : Unsplash (Brett Jordan)

Les spams sont des messages indésirables qui sont souvent envoyés en masse à de nombreux utilisateurs aléatoires. Ces messages peuvent contenir des publicités, mais aussi des liens de phishing ou des malwares. Le filtrage automatique des e-mails et l’identification des spams sont très avantageux, car ils peuvent réduire le risque d’attaques de phishing et faciliter la navigation des utilisateurs dans leurs comptes.

Au cours des dernières années, les informaticiens ont développé des modèles de calcul de plus en plus avancés pour détecter automatiquement les spams. Pour bien fonctionner, cependant, la plupart de ces modèles doivent être entraînés sur de grands ensembles de données de courrier électronique, qui ont été étiquetés manuellement par des humains.

Des chercheurs du Sinhgad Institute of Technology Lonavala en Inde ont récemment créé une nouvelle technique de détection automatique des spams. Cette technique, présentée dans un article publié dans le Journal international de la robotique intelligente et des applications, pourrait aider à améliorer la sécurité des utilisateurs, tout en les aidant à parcourir les e-mails non pertinents ou indésirables.

“Notre modèle réduit également les vitesses d’entraînement et conduit à une plus grande efficacité de classification”, a déclaré à TechXplore Vikas Samarthrao Kadam, l’un des chercheurs qui a mené l’étude. “Contrairement à d’autres modèles, il augmente le taux de convergence de la détection des spams, obtenant de meilleurs résultats.”

Le modèle développé par Kadam et ses collègues est basé sur la sélection de caractéristiques multi-objectifs et sur un réseau de capsules adaptatives, une nouvelle technique d’apprentissage en profondeur très prometteuse. Contrairement à d’autres méthodes développées précédemment, le modèle a été formé à la fois sur des ensembles de données d’images et de textes.

“Notre modèle introduit un nouvel algorithme heuristique hybride et permet une sélection optimale des fonctionnalités, avec une fonction multi-objectifs”, a expliqué Kadam. “Notre travail confirme la promesse de modèles de détection nouveaux et améliorés basés sur des algorithmes d’apprentissage en profondeur. La détection automatique des spams est nécessaire en raison de sa simplicité.”

Le modèle développé par les chercheurs est facile à mettre en œuvre et peut être formé rapidement, sur de courtes périodes de temps. Lors des premières évaluations, Kadam et ses collègues ont constaté qu’il pouvait détecter les spams avec une plus grande précision que les autres méthodes existantes.

“La détection des spams est essentielle car elle peut garantir la justice pour les vendeurs et conserver la confiance de l’acheteur sur les boutiques en ligne”, a déclaré Kadam. “Contrairement à d’autres méthodes, cela améliore la vitesse d’entraînement et l’efficacité de la classification. Notre modèle pourrait améliorer la qualité de vie des personnes qui reçoivent de grandes quantités d’e-mails, leur permettant de parcourir leur e-mail de manière fluide et d’utiliser leurs comptes uniquement pour leur le but recherché.”

À l’avenir, la technique de filtrage du spam créée par Kadam et ses collègues pourrait être mise en œuvre à grande échelle, améliorant la sécurité et l’efficacité des services de messagerie. Remarquablement, le modèle peut être appliqué à un large éventail de services existants, notamment Gmail, Yahoo mail et Outlook.

“Presque tous les chercheurs présentent leurs résultats en fonction de l’exactitude, de la précision et du rappel de leurs modèles, mais nous pensons que la complexité temporelle des modèles d’apprentissage automatique devrait également être considérée comme une métrique d’évaluation”, a déclaré Kadam. “Certains chercheurs montrent des résultats prometteurs dans le processus d’extraction de caractéristiques à l’aide d’un sac de mots, car ils affirment que l’en-tête de l’e-mail est aussi important pour la détection du spam que le contenu du corps. Ainsi, l’extraction approfondie des caractéristiques de la ligne d’en-tête pourrait également être envisagée à l’avenir.”

Jusqu’à présent, la nouvelle technique de filtrage du spam mise au point par cette équipe de recherche a obtenu des résultats très prometteurs, car elle pouvait détecter efficacement les spams avec une grande précision. Cependant, Kadam et ses collègues estiment que sa vitesse et sa précision pourraient encore être améliorées à l’avenir.

“La sécurité des systèmes de détection et de filtrage des spams est cruciale pour obtenir une meilleure précision et des résultats fiables, qui peuvent être améliorés à l’avenir en utilisant l’apprentissage d’ensemble”, a ajouté Kadam. “Le taux de faux positifs de nombreux modèles est encore plus élevé que nécessaire, mais il devrait être réduit à la plus petite valeur possible à l’avenir. La classification du spam en temps réel est indispensable, car la plupart des modèles proposés ne fonctionnent pas bien avec le temps réel. Les données.”


Comment savoir quand il est sûr de cliquer sur ‘se désabonner’ sur un e-mail de spam


Plus d’information:
Kadam Vikas Samarthrao et al, Une sélection de fonctionnalités multi-objectifs basée sur des méta-heuristiques hybrides avec un réseau de capsules adaptatives pour la détection automatisée des spams par e-mail, Journal international de la robotique intelligente et des applications (2022). DOI : 10.1007 / s41315-021-00217-9

© 2022 Réseau Science X

Citation: Un nouveau modèle pour détecter et filtrer automatiquement les spams (18 mars 2022) récupéré le 18 mars 2022 sur https://techxplore.com/news/2022-03-automatically-filter-spam-emails.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation loyale à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.