Un outil de reconnaissance d’images pour détecter les attaques de typosquatting

TypoSwype : Un outil de reconnaissance d'images pour détecter les attaques de typo-squatting

Crédit : Lee & Yam.

Au cours des dernières décennies, les cyberattaques sont devenues de plus en plus variées, introduisant diverses stratégies pour attirer les utilisateurs sur des sites Web malveillants ou les inciter à partager des données sensibles. En conséquence, les informaticiens tentent en permanence de développer des outils plus avancés pour détecter et neutraliser ces attaques.

Le typosquatting, l’une des attaques les plus courantes menées en ligne, exploite la tendance humaine à mal orthographier les mots lors de la frappe rapide ou à mal lire les mots lorsqu’ils comportent de petites erreurs topographiques. Le typosquatting consiste essentiellement à créer des sites Web malveillants avec des URL qui ressemblent à des sites établis, mais avec de légères fautes de frappe (par exemple, “fqcebook” au lieu de “facebook” ou “yuube” au lieu de “youtube”). Lorsqu’un utilisateur visite par erreur ces sites Web, il peut télécharger involontairement des logiciels malveillants ou finir par partager des informations personnelles avec les attaquants.

La plupart des techniques existantes pour détecter ces attaques de phishing reposent sur des outils de vérification orthographique. Bien que ces outils puissent fonctionner dans certains cas, ils ne se généralisent pas bien, car leurs performances dépendent généralement du vocabulaire des mots utilisés pour les former.

Des chercheurs d’Ensign InfoSecurity, un fournisseur de services de cybersécurité de bout en bout basé à Singapour, ont récemment créé TypoSwype, un outil alternatif de détection des attaques de typo-squattage basé sur l’analyse d’images. Cet outil, présenté dans un article prépublié sur arXiv, utilise des techniques avancées de reconnaissance d’images pour convertir les chaînes en images qui tiennent également compte de l’emplacement des lettres sur le clavier.

“Le typosquattage utilise des erreurs typographiques ou des fautes de frappe (par exemple, ‘googgle.com’ au lieu de ‘google.com’) pour tromper les utilisateurs afin qu’ils accèdent à des sites Web indésirables”, a déclaré David Yam, l’un des chercheurs qui a mené l’étude, à TechXplore. “Les techniques actuelles pour lutter contre ces attaques de phishing utilisent une distance d’édition de chaînes qui ne dépend pas de la position des caractères du clavier (“g” se trouve dans une zone de clavier différente de “z”) et sont donc moins précises pour détecter les fautes de frappe (par exemple, “googgle. com” et “googzle.com” est également éloigné de “google.com”). Nous utilisons des techniques de reconnaissance d’images telles que les réseaux de neurones convolutifs (CNN) et des fonctions de perte spécifiques pour améliorer la détection des fautes de frappe.”

TypoSwype : Un outil de reconnaissance d'images pour détecter les attaques de typo-squatting

Domaines (à gauche) et leurs versions de type Swype (à droite). domaines typosquattés qui ont été regroupés à l’aide de leurs versions de type Swype. Crédit : Lee & Peng David.

Contrairement à d’autres méthodes de détection de typosquatting introduites dans le passé, TypoSwype peut capturer la distance entre différents caractères sur le clavier, en traçant des lignes entre les boutons de caractères consécutifs sur un clavier imaginaire. Cela permet de réduire les erreurs que les métriques de distance d’édition de chaîne existantes (c’est-à-dire les méthodes qui calculent la différence entre deux mots ou séquences de caractères) sont susceptibles de se produire.

“Nous avons utilisé des techniques de reconnaissance d’images car elles peuvent traiter par lots plusieurs domaines typosquattés possibles en une seule fois, ce qui permet un traitement plus rapide par rapport aux solutions de correspondance de chaînes”, a expliqué Lee. “De plus, l’utilisation des entrées Swype nous permet d’afficher visuellement des entrées susceptibles d’être des typosquats les unes des autres, telles que” fqcebook “et” facebook “.”

Yam et son collègue Lee Joon Sern ont évalué leur outil de détection de typosquattage dans une série de tests, comparant ses performances à celles de l’algorithme DLD, un modèle de cybersécurité largement utilisé. Ils ont découvert que TypoSwype pouvait détecter le typosquattage de manière plus fiable que DLD, tout en identifiant avec précision les domaines bien établis et sûrs que les attaquants tentaient de copier ou de “typo-squatter”.

“TypoSwype est (à notre connaissance) la première application des CNN pour lutter contre le typosquattage à l’aide des entrées Swype”, a déclaré Yam. “L’utilisation de Swype capture intrinsèquement la métrique de distance du clavier que les erreurs typographiques ont généralement. Nous utilisons également la perte de triplet et la perte de NT-Xent comme mécanismes supérieurs pour former notre modèle, car il fournit une limite minimale entre les images Swype non similaires. Cela nous permet de améliorer les métriques (score F1) dans la détection des domaines de typosquatting qui sont déjà assez similaires (à une distance d’édition) par des algorithmes de correspondance de distance d’édition de chaîne.

Les travaux récents de cette équipe de chercheurs pourraient bientôt inspirer le développement d’autres techniques de cybersécurité basées sur des modèles de reconnaissance d’images. Pendant ce temps, TypoSwype sera inclus dans la suite d’outils de détection de phishing d’Ensign InfoSecurity, le rendant disponible aux utilisateurs du monde entier.


Une navigation Web plus sûre grâce à une nouvelle méthode de détection des modes malveillants


Plus d’information:
Joon Sern Lee, Yam Gui Peng David, TypoSwype : Une approche d’imagerie pour détecter les typo-squats. arXiv:2209.00783v1 [cs.CR]arxiv.org/abs/2209.00783

© 2022 Réseau Science X

Citation: TypoSwype : Un outil de reconnaissance d’image pour détecter les attaques de typosquatting (13 octobre 2022) récupéré le 13 octobre 2022 sur https://techxplore.com/news/2022-10-typoswype-image-recognition-tool-typosquatting.html

Ce document est soumis au droit d’auteur. En dehors de toute utilisation loyale à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans l’autorisation écrite. Le contenu est fourni seulement pour information.